機械学習

深層強化学習論文リストを作り始めた

前にDQNの再現の記事を書いてからほぼ1年が空いてしまいました.DQNの新しい論文が2月にNatureに載ったのは記憶に新しいですが,それから研究はさらに加速し,最近では自分の感覚としてはarxiv含めて平均すると1週間に1論文くらいのペースで深層強化学習の研…

CaffeでDeep Q-Networkを実装して深層強化学習してみた

概要 深層学習フレームワークCaffeを使って,Deep Q-Networkという深層強化学習アルゴリズムをC++で実装して,Atari 2600のゲームをプレイさせてみました. Deep Q-Network Deep Q-Network(以下DQN)は,2013年のNIPSのDeep Learning Workshopの"Playing At…

流行りの深層学習フレームワークCaffeをC++から使ってみた

Caffeとは CaffeはBerkeley Vision and Learning Centerというところが中心となって開発している深層学習(Deep learning)フレームワークです.公式サイトの記述によれば 速い("We believe that Caffe is the fastest CNN implementation available") GPU…

Magic: The Gathering + word2vec = "card2vec" 〜M:TGで自然言語処理〜

概要 最近word2vecという単語のベクトル表現を学習して単語の意味を足したり引いたりできるものが流行っていて面白そうだったので試しにMagic: The Gatheringについて学習させてみました.card2vecは勝手に作った造語です. 手順 自然言語処理をなにも知らな…

論文メモ(2013/12/29-2014/01/04)

D. Mnih et al. (2013), "Playing Atari with Deep Reinforcement Learning" 強化学習におけるDeep Learningの試み Q-learningにおけるQ関数の学習に3つの隠れ層を持つネットワークを用いる(Deep Q-Network,略してDQN) 入力は画面のピクセルの縮小・グレ…