[[ item.title ]]
Mini wiki
A3C
编辑
A3C是由
Google DeepMind
团队于2016年提出的一种基于异步梯度的深度强化学习框架,利用了多线程同时并行运行的特点,让多个Actor并行训练而定期与全局参数同步。该方法在Atari游戏和3D迷宫等方面都有不错的效果。
5
图片
0 图片
评论
0 评论
匿名用户
·
[[ show_time(comment.timestamp) ]]
[[ nltobr(comment.content) ]]