kerneltyu’s tech blog

理系学生です.

【論文】Human Feedback as Action Assignment in Interactive Reinforcement Learning

こんにちは、ご無沙汰です。今回は読んだ論文の内容のまとめをここに記録しようと思います。自分は強化学習に対して人の知識を転移するというような研究をしていて、Human-friendlyな転移方法は何か?ということに興味を持っています。自分用のメモのように…

DeepMindLabのPython Module導入

前回の投稿から続いて今度はDeepMindLabのPython Moduleの導入をします。 これによってOpenAIgymのような形で、pythonによるプログラムで環境から観測を受け取ったり、行動を環境に適用させたりすることができます。 Python Moduleの導入に関しては、下記に…

DeepMindLabのインストール

1年ぶりの投稿になります。お久しぶりです。 インストールで詰まったときの解決策ばかりになるような気もしますが、自分でも見返すんでどんどんメモっていこうと思います。 3年前くらいに強化学習の環境のプラットフォームがどんどん公開されていたときにGoo…

【メモ:本】Tensorflow活用ガイドのサンプルコードで躓いた時の対処

機械学習アプリケーション開発入門TensorFlow活用ガイドの4章 自然言語処理のサンプルコードをWindows上で動かそうとしたときに詰まった個所とその対処法について残します.4-3文書の分類のコードについてです. 環境 Windows 10 Anacondaの仮想環境 Python …

今更ながら方策反復(Policy iteration)を勉強(実装)してみた

こんばんは,大学院に進学してから本格的に機械学習の勉強をし始めました.その学習記録を残そうかなと思います.まぁ,自分で実装したアルゴリズムとかだけを書いていくつもりです. 今回は,強化学習をやっている人なら誰しも目を通したことがあるはずのSu…

TensorflowでFutureWarning: Conversion of the second argument ... が出た時

お久しぶりです. Tensorflowを本格的に始めようとしてTensorflowをインストールをしました. インストールできたはいいものの,FutureWarningが出てしまいました.実行には何の問題もないんですが,出力が非常に見にくい! 調べて見たら,issueに改善方法が…

Anaconda仮想環境構築からOpenAi Gymのフルインストール

前回にOpenAiGymの導入でのエラーについて書いたが、今回はAnacondaで作成した仮想環境上でフルインストールを行いました。 まずAnacondaで仮想環境を作成して、activateする手順です。 仮想環境は、pythonのバージョンとかライブラリの管理が楽になるので使…

論述とはなにか?

久しぶりの文系科目の授業のレポートで論述しなさいという課題を出されました.論述ってなんだっけとなり調べたのでメモ代わりにここに書いておきます. 論述とは? あるテーマが与えられたとき、そのテーマに対する考え方の事例を要約して紹介し、それに対…

研究者になるために必要なスキル

最近,活躍中の研究者の方々と話す機会が頻繁にあってそこで聞いた話をまとめておきます. 研究者という仕事について 仕事内容は研究! 当たり前だけど,研究者の仕事は研究をすること.業績を残すためや自分の興味のために研究を進めている.研究以外では,…

OpenAI Gymの導入でOS Error: [Errno 1]が出てしまった

OpenAI Gym 以前から存在は知っていて使ってみたいなと思っていました。今回、輪講で出てきたこともあり輪講内容の理解を深めるためや今後の強化学習のアルゴリズムの勉強のためにもここで導入しようと踏み切りました! しかし、導入しただけではここには書…

功利主義と義務主義の授業で考えたこと

今日,工学倫理の授業で考えていたことを残します. キーワード: 正義,価値観,ルールの重さ 授業の内容 功利主義と義務主義について, 功利主義は,最大多数の最大幸福を求める立場で,一方で義務主義は,果たすべき義務があるとする立場である. 講義中…

初投稿

調べたことのまとめなど,主に自分の記憶の補助に使っていきます.