A3C 编辑
A3C是由Google DeepMind团队于2016年提出的一种基于异步梯度的深度强化学习框架,利用了多线程同时并行运行的特点,让多个Actor并行训练而定期与全局参数同步。该方法在Atari游戏和3D迷宫等方面都有不错的效果。
5
图片 0 图片
评论 0 评论
匿名用户 · [[ show_time(comment.timestamp) ]]
[[ nltobr(comment.content) ]]