Skip to content

Prioritized Experience Replay #17

@sarrrrry

Description

@sarrrrry

一言でいうと

ANMLの中のリプレイ法で紹介された論文
↓ 詳細は以下の記事がわかりやすかった
https://qiita.com/d-ogawa/items/38dcdfda926739b49d55

リプレイ法とは,以前の経験を保存し、新たに遭遇したデータと混合する事で忘却を軽減する手法で,タスクをスケーリングしていくことは計算コストや記憶の点で,出来ない

論文リンク

https://arxiv.org/abs/1511.05952

著者/所属機関

Tom Schaul, John Quan, Ioannis Antonoglou and David Silver
Google DeepMind
{schaul,johnquan,ioannisa,davidsilver}@google.com

投稿日付(yyyy/MM/dd)

[v1] Wed, 18 Nov 2015 20:54:44 UTC (1,194 KB)

概要

新規性・差分

手法

結果

コメント

Metadata

Metadata

Assignees

Labels

No labels
No labels

Type

No type

Projects

No projects

Milestone

No milestone

Relationships

None yet

Development

No branches or pull requests

Issue actions