A3C - The mini wiki

A3C 编辑

A3C是由Google DeepMind团队于2016年提出的一种基于异步梯度的深度强化学习框架，利用了多线程同时并行运行的特点，让多个Actor并行训练而定期与全局参数同步。该方法在Atari游戏和3D迷宫等方面都有不错的效果。