-
Notifications
You must be signed in to change notification settings - Fork 0
Open
Description
一言でいうと
ANMLの中のリプレイ法で紹介された論文
↓ 詳細は以下の記事がわかりやすかった
https://qiita.com/d-ogawa/items/38dcdfda926739b49d55
リプレイ法とは,以前の経験を保存し、新たに遭遇したデータと混合する事で忘却を軽減する手法で,タスクをスケーリングしていくことは計算コストや記憶の点で,出来ない
論文リンク
https://arxiv.org/abs/1511.05952
著者/所属機関
Tom Schaul, John Quan, Ioannis Antonoglou and David Silver
Google DeepMind
{schaul,johnquan,ioannisa,davidsilver}@google.com
投稿日付(yyyy/MM/dd)
[v1] Wed, 18 Nov 2015 20:54:44 UTC (1,194 KB)
概要
新規性・差分
手法
結果
コメント
Reactions are currently unavailable
Metadata
Metadata
Assignees
Labels
No labels