在《深度Q学习算法详解》一节中,我们使用了深度 Q 学习来进行 Cart-Pole 游戏。在本节中,我们将利用深度Q学习来玩“太空侵略者”游戏 (SpaceInvaders),这是一个比 Cart-Pole 更复杂的环境。
Cart-Pole
SpaceInvaders
“太空侵略者”游戏的屏幕截图示例如下所示,智能体的目标是使单个游戏回合中获得的分数最大化。
为了能够最大化智能体的得分,我们采用的模型构建策略如下:
Space Invaders-Atari2600
上一篇:PID控制算法进阶
下一篇:07- 梯度下降优化(Lasso/Ridge/ElasticNet) (机器学习)