深層強化学習論文リストを作り始めた

機械学習

前にDQNの再現の記事を書いてからほぼ1年が空いてしまいました．DQNの新しい論文が2月にNatureに載ったのは記憶に新しいですが，それから研究はさらに加速し，最近では自分の感覚としてはarxiv含めて平均すると1週間に1論文くらいのペースで深層強化学習の研…

2014-10-21

CaffeでDeep Q-Networkを実装して深層強化学習してみた

機械学習ゲームAI

概要深層学習フレームワークCaffeを使って，Deep Q-Networkという深層強化学習アルゴリズムをC++で実装して，Atari 2600のゲームをプレイさせてみました． Deep Q-Network Deep Q-Network（以下DQN）は，2013年のNIPSのDeep Learning Workshopの"Playing At…

2014-10-10

流行りの深層学習フレームワークCaffeをC++から使ってみた

C++ 機械学習

Caffeとは CaffeはBerkeley Vision and Learning Centerというところが中心となって開発している深層学習（Deep learning）フレームワークです．公式サイトの記述によれば速い（"We believe that Caffe is the fastest CNN implementation available"） GPU…

2014-03-19

Magic: The Gathering + word2vec = "card2vec" 〜M:TGで自然言語処理〜

機械学習ゲームAI

概要最近word2vecという単語のベクトル表現を学習して単語の意味を足したり引いたりできるものが流行っていて面白そうだったので試しにMagic: The Gatheringについて学習させてみました．card2vecは勝手に作った造語です．手順自然言語処理をなにも知らな…

2014-01-05

論文メモ（2013/12/29-2014/01/04）

ゲームAI 機械学習

D. Mnih et al. (2013), "Playing Atari with Deep Reinforcement Learning" 強化学習におけるDeep Learningの試み Q-learningにおけるQ関数の学習に3つの隠れ層を持つネットワークを用いる（Deep Q-Network，略してDQN）入力は画面のピクセルの縮小・グレ…