带有经验回放的演员-评论家算法 编辑
带有经验回放的演员-评论家算法,简称ACER。是2017年由DeepMind团队在提出的算法。其论文发表在ICLR上。该文提出了一种基于深度强化学习Actor-Critic下带有经验回放的算法,能够在变化的环境中取得不错的效果,其中包括了57个Atari游戏以及一些需要持续控制的问题。
7
图片 0 图片
评论 0 评论
匿名用户 · [[ show_time(comment.timestamp) ]]
[[ nltobr(comment.content) ]]