以下文章来源于RLCN ,作者RLChina
RLChina强化学习社区公众号(RLCN) 发布强化学习、博弈论、多智能体系统、机器学习相关的论文解读、学术动态、产业新闻等内容。
导读
课程安排
时 间
2021 年 8 月 16 日至 22 日
讲 师
来自全球顶尖高校和企业的 20 位强化学习专家
授 课 形 式
开放的免费网络直播课程
课 程 内 容
覆盖强化学习入门、进阶、前沿、实战,适合各种阶段和各种背景的强化学习爱好者。
课程介绍
1.课程表
今年的暑期课将持续一周时间,周一至周五是主课和习题课,周六和周日分别是智能体竞赛日和决策智能创业日,具体的课程表如下:
2.报名方式
扫码进群,即可报名并获得学习资料,完成习题课的学员还将发放电子版结课证书哦!
教师介绍
第1课 机器学习入门
—— 机器学习和深度学习基础
机器学习进阶
第2课—— 机器学习中的优化理论和方法
第6课 强化学习入门(二)
—— 规划和马尔可夫决策过程
强化学习进阶(一)
第7课—— 强化学习的样本复杂性和探索
第9课 强化学习前沿(一)
—— 离线强化学习
第10课 强化学习前沿(二)
—— 模仿学习
俞扬博士,南京大学教授,国家万人计划青年拔尖人才。主要研究领域为机器学习、强化学习。获 2013 年全国优秀博士学位论文奖、 2011 年CCF优秀博士学位论文奖。发表论文 40 余篇,包括多篇 Artificial Intelligence、IJCAI、AAAI、NeurIPS、KDD等,获得4项国际论文奖励和2项国际算法竞赛冠军,入选 2020 年 CCF-IEEE CS 青年科学家奖、2018 年 IEEE Intelligent Systems 杂志评选的“国际人工智能 10 大新星”,获 2018 亚太数据挖掘“青年成就奖”,受邀在 IJCAI’18 作关于强化学习的“青年亮点”报告。
第11课 多智能体入门(一)
—— 多智能体学习
杨耀东博士现任英国伦敦大学国王学院计算机系助理教授,科研领域包括强化学习、博弈论和多智能体强化学习,相关的研究成果在国际会议和期刊上发表超过 30 篇学术论文。杨耀东长期担任 ICML、NeurIPS、ICLR、AAAI 等机器学习会议程序委员和 JMLR、IEEE TNNLS、IEEE Cybernatics 审稿人。他的研究工作于 2020 年获国际机器人学习会议 CoRL 最佳系统论文奖, 2021 年获国际多智能体系统会议 AAMAS (blue sky track)最佳论文奖。杨耀东于中国科学技术大学获得学士学位,于英国帝国理工大学获得硕士学位,于英国伦敦大学学院获得博士学位。
第12课 多智能体入门(二)
—— 智能体策略的评估
杜雅丽,伦敦大学学院多智能体学习团队研究员,于 2019 年获悉尼科技大学博士学位。主要研究兴趣为机器学习、强化学习及其在游戏 AI、推荐检索和传统控制问题中的应用。目前主要从事多智能体算法的设计和研究,包括灵活控制任意数量的智能体、奖励多样性行为、多智能体信用分配、多智能体交互结构学习和学习模型的鲁棒性等。相关研究成果已广泛发表在 ICML、NeurIPS、IJCAI、IEEE TMM 等刊物。
第13课 多智能体进阶(一)
—— 多智能体强化学习算法
张崇洁,清华大学交叉信息科学院助理教授,博士生导师。2011 年在美国麻省大学阿默斯特分校获计算机科学博士学位,而后在美国麻省理工学院从事博士后研究。目前的研究专注于人工智能、深度强化学习、多智能体系统等领域。相关的研究成果在 ICLR、ICML、NeurIPS、AAAI 等国际会议上发表 30 余篇学术论文。
第14课 多智能体进阶(二)
—— 基于平均场的多智能体强化学习
第15课 多智能体前沿(一)
—— 捉迷藏游戏策略和开放问题
第16课 多智能体前沿(二)
—— 深度学习求解大规模复杂博弈
第17课 专题报告(一)
—— 强化学习训练系统
第18课 专题报告(二)
—— 多智能体通信与协同中的博弈论与强化学习
第19课 专题报告(三)
—— 强化学习在快手的应用
第20课 专题报告(四)
—— 深度强化学习的挑战和落地
习题课
—— 动手学强化学习