2014-01-01から1年間の記事一覧
概要 深層学習フレームワークCaffeを使って,Deep Q-Networkという深層強化学習アルゴリズムをC++で実装して,Atari 2600のゲームをプレイさせてみました. Deep Q-Network Deep Q-Network(以下DQN)は,2013年のNIPSのDeep Learning Workshopの"Playing At…
Caffeとは CaffeはBerkeley Vision and Learning Centerというところが中心となって開発している深層学習(Deep learning)フレームワークです.公式サイトの記述によれば 速い("We believe that Caffe is the fastest CNN implementation available") GPU…
2014年のInternational General Game Playing Competition(IGGPC)の参加記録です.IGGPCは2005年から毎年開催されているGeneral Game Playingの世界大会です. General Game Playingとはなにか ゆるい概要についてはゲームAI研究について何も知らなくても…
概要 最近word2vecという単語のベクトル表現を学習して単語の意味を足したり引いたりできるものが流行っていて面白そうだったので試しにMagic: The Gatheringについて学習させてみました.card2vecは勝手に作った造語です. 手順 自然言語処理をなにも知らな…
C++でcharからstd::stringへの変換(文字から文字列へ,例えば'a'から"a"へ)をどうするか,すごく簡単そうに見えていざ検索してみるとchar[]とstd::stringの間の変換についての記述しか見つからなかったので書いておこうと思います. 「std::stringのコンス…
概要 あるサーバ上でC++11の機能をフルに使いたかったがGCCが古かったのでGCC 4.8.2を新たにインストールした.管理者権限が無いのでソースからコンパイルして$HOME/localにインストールした. 環境 OS Linux x86_64 元のGCC 4.3.2 手順 # Download GCC 4.8.…
プログラミング中などによくある「Vimでテキストファイルを開いたら^@という文字が表示されてるけどこれどういう意味だっけ」「Makefile中の$Googleは悲しいほどに無力です.そんなときの選択肢. Stack Overflowで検索する 記号検索が可能な質問サイト.大…
D. Mnih et al. (2013), "Playing Atari with Deep Reinforcement Learning" 強化学習におけるDeep Learningの試み Q-learningにおけるQ関数の学習に3つの隠れ層を持つネットワークを用いる(Deep Q-Network,略してDQN) 入力は画面のピクセルの縮小・グレ…