[[ item.title ]]
Mini wiki
带有经验回放的演员-评论家算法
编辑
带有经验回放的演员-评论家算法,简称ACER。是2017年由
DeepMind
团队在提出的算法。其论文发表在ICLR上。该文提出了一种基于深度强化学习Actor-Critic下带有经验回放的算法,能够在变化的环境中取得不错的效果,其中包括了57个Atari游戏以及一些需要持续控制的问题。
7
图片
0 图片
评论
0 评论
匿名用户
·
[[ show_time(comment.timestamp) ]]
[[ nltobr(comment.content) ]]