用强化学习玩《超级马里奥》

CSDN头条 3年前 (2022) csdnhot

916 0 0

查看原文

内容简介：

Pytorch的一个强化的学习教程（ Train a Mario-playing RL Agent）使用超级玛丽游戏来学习双Q网络(强化学习的一种类型)，官网的文章只有代码，所以本文将配合官网网站的教程详细介绍它是如何工作的，以及如何将它们应用到这个例子中。

强化学习是如何起作用的
机器学习可以分为三类:监督学习、非监督学习和强化学习。

在监督学习中，模型被赋予一个训练数据集，该数据集包含输入和输出(标签)。它从这些数据中学习，了解如何从输入中获得输出。训练完成后使用测试数据集（包含模型从未见过的输入），模型必须尝试预测每个数据点应该被赋予的标签。
在无监督学习中，模型被赋予一个数据集，但数据点都没有标签。它被提供数据点和一些簇来将它们分组。随着簇数量的变化，算法的输出也...

版权声明：csdnhot 发表于 2022-12-01 19:08:14。
转载请注明：用强化学习玩《超级马里奥》 | 程序员导航网

暂无评论

您必须登录才能参与评论！

立即登录

暂无评论...

用强化学习玩《超级马里奥》

查看原文

内容简介：

全家桶Spring、HikariCP、Mybatis和Oracle配置，你想要的都在这里

待办清单类产品需求规划说明书

暂无评论

用强化学习玩《超级马里奥》

查看原文

内容简介：

全家桶Spring、HikariCP、Mybatis和Oracle配置，你想要的都在这里

待办清单类产品需求规划说明书

暂无评论

收藏至：