用强化学习玩《超级马里奥》

CSDN头条 3年前 (2022) csdnhot
916 0

查看原文

该头条内容由程序员导航网提供:用强化学习玩《超级马里奥》

内容简介:

Pytorch的一个强化的学习教程( Train a Mario-playing RL Agent)使用超级玛丽游戏来学习双Q网络(强化学习的一种类型),官网的文章只有代码, 所以本文将配合官网网站的教程详细介绍它是如何工作的,以及如何将它们应用到这个例子中。

强化学习是如何起作用的
机器学习可以分为三类:监督学习、非监督学习和强化学习。

在监督学习中,模型被赋予一个训练数据集,该数据集包含输入和输出(标签)。它从这些数据中学习,了解如何从输入中获得输出。训练完成后使用测试数据集(包含模型从未见过的输入),模型必须尝试预测每个数据点应该被赋予的标签。
在无监督学习中,模型被赋予一个数据集,但数据点都没有标签。它被提供数据点和一些簇来将它们分组。随着簇数量的变化,算法的输出也...

版权声明:csdnhot 发表于 2022-12-01 19:08:14。
转载请注明:用强化学习玩《超级马里奥》 | 程序员导航网

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...