内容简介:
目录
1 案例介绍
2 构造深度Q网络
3 经验回放与目标网络
4 训练流程
5 实验分析
1 案例介绍
Flappy Bird是一款由来自越南的独立游戏开发者Dong Nguyen所开发的作品,于2013年5月24日上线。 在Flappy Bird中,玩家只需要用一根手指来操控:点击一次屏幕,小鸟就会往上飞一次,不断地点击就会使小鸟不断往高处飞。放松手指,小鸟则会快速下降。所以玩家要控制小鸟一直向前飞行,然后注意躲避途中高低不平的管子。小鸟每安全穿过一个水管得1分,若撞上水管则游戏失败。
如图所示是用强化学习模型DQN训练AI完成Flappy Bird游戏的...
查看原文
暂无评论...