桃良 发自 凹非寺
量子报道| QbitAI,微信官方账号
学习的枯燥似乎有种魔力,让人无法提起干劲。
看着我最爱的各种课程,感觉基本上逃不开吃灰的命运。
除了它——可以“玩游戏”的深度强化学习课程。
阿里科技副总裁贾表示:
人工智能课程是玩游戏。
这句话非常适合这门课!
在课程中,你可以建立自己的智能体,然后教他们学会玩太空侵略者,我的世界,星际争霸,刺猬索尼克等等!
△来源:simoninithomas
怎么样?是不是心动了。
然后开始你游戏代理的学习之旅。
深度强化学习简介
深度强化学习是一种利用深度学习技术扩展传统强化学习方法的机器学习方法。
传统强化学习方法的学习内容是:
智能体根据从环境中所获得的奖励,来学习如何才能够使自身获取的奖励最大化。根据从环境中获得的回报,代理人学习如何最大化自己获得的回报。
△来源:simoninithomas
而传统无模型的强化学习方法则需要使用到函数逼近方法,然后让智能体能够学习得出值函数或策略。
在这种情况下,深度学习中强大的函数逼近能力显示出其优势,并被研究者所使用。
于是,二者的交叉——深度强化学习就出现了。
深度强化学习的标志性开端是2013年的论文《用深度强化学习玩雅达利》
之后,基于深度强化学习的AlphaGo和OpenAI Five等人工智能在各类复杂游戏中相继击败了人类顶尖玩家,引起了各方的关注。
此外,深度强化学习在其他领域也得到了不同程度的研究和应用,如机械手敏捷训练、室内定位、智能交通等。
课程内容
该课程一共分为12章:本课程分为12章:
【贾扬清 “人工智能课程是玩游戏” 贾扬清的话被这个课实现了|资源】可以看到,从DRL基础到Q-Learning,深度Q-Learning,再到策略梯度,最后是Unity机器学习代理。
作者用一个循序渐进的过程讲授了各类常见且主流的深度强化学习的方法。
同时,最大的看点在于每一章都安排了不同的游戏做法。
这很令人兴奋不是嘛?
动手去这些游戏建立自己的智能体!去这些游戏,建立你自己的代理!
△来源:simoninithomas
对此,作者Thomas Simonini介绍道:
自从2018年第一版这门课程推出以来,我们已经发布了许多新的库:TF-agent、Stable-Baseline 2.0……以及环境:MineRL、Unity ML-agent、OpenAI retro。您现在可以访问许多游戏来构建自己的代理。
这就是为什么这是开始学习的最佳时机,而使用本课程,你来对地方了。
这是一门从初学者到专家的免费课程,在这里你将掌握所需的技能和架构,成为强化学习的专家。
关于作者
托马斯·西蒙尼尼尼
一位热衷于强化学习教育及其在视频游戏行业中的应用的视频游戏从业者。
2016年获得法学、政治学学士学位,之后开始自学数学,深入学习,深入精读。
2017年进入Udacity学习并分别获得了深度学习、人工智能的Nano学位。
2018年,他开设了深度强化学习课程,这是一个免费的开源文章和视频系列。这门课程已经成功获得了45000+的好评,每周大约有4000名读者。
资源获取
本课程的全部内容可以在Github中找到:
https://simoninithomas.github.io/deep-rl-course/#syllabus
作者在Youtube上的个人账号:
https://www.youtube.com/a/202112/thomassimonini?sub_confirmation=1
参考链接:
https://simoninithomas.github.io/deep-rl-course/#syllabus
https://zh . Wikipedia . org/wiki/% E6 % B7 % B1 % E5 % BA % A6 % E5 % BC % BA % E5 % 8C % 96% E5 % AD % A6 % E4 % B9 % A0
推荐阅读
- 爱心义诊“进家门”!苏州市相城区黄桥街道方浜村贴心服务暖民心
- 连烧数月难寻因 河南小伙肺毁损 医生耗时一个月摸到发烧“开关”小伙写千字长文妙语连珠谢医护
- 常敲“一氧化碳中毒”警钟 科学防范 温暖过冬
- 博爱县月山镇:凝心聚力改善人居环境 村庄“旧貌换新颜”
- 广西中医药大学第一附属医院:“内”“外”兼并 大力弘扬中医药文化
- 夫妻“小别重逢”过后,男人会有这两个表现
- 新冠肺炎患者集中康复出院 “白衣战士”画新作:“相信阳光离我们不远了”
- 新春走基层丨杨国贵:“养牛倌”走上致富路
- 信阳浉河区:宜居环境助力幸福生活“节节高”
- 只想躺平?您可能是病了!“工作倦怠”正式成为疾病