导读
前沿讲习班是RLChina举办的学术活动,每期就某一研究话题邀请若干位专家作线上报告,并组织感兴趣的同学交流研讨。第2期前沿讲习班的话题是游戏智能体,将由中国科学院自动化研究所朱圆恒老师和网易伏羲实验室陈赢峰老师为大家分享最新的研究进展,欢迎大家参与。互动方式:在本帖留言,可与报告嘉宾互动。
简介
主题
RLChina前沿讲习班第2期——游戏智能体专题
时间
2021年11月09日 19:00至21:00
网址
B站RLChina直播间
http://live.bilibili.com/22386217报告人
朱圆恒 中国科学院自动化研究所
陈赢峰 网易伏羲实验室
主持人
林舒 中国科学院自动化研究所
报告信息
第一场 19:00-20:00
报告人:朱圆恒
报告人简介
朱圆恒,中国科学院自动化研究所副研究员,硕士生导师。主要研究领域包括深度强化学习、多智能体强化学习,以及在博弈对抗、智能决策、游戏对抗等领域的应用。目前已经发表论文50余篇,SCI期刊论文20余篇。主持或参与国家自然科学基金、科技部科技创新2030重大项目、中国科学院战略性先导科技专项,JW科技委创新特区等多个国家级项目。带领学生参加IEEE COG格斗游戏比赛、IEEE ICRA Robomaster AI Challenge、SSCAIT星际争霸天梯赛等获第一名。2017年由中国科学院资助访问美国罗德岛大学为期12个月。入选中国科学院青年创新促进会会员,现任中国自动化学会数据驱动控制学习与优化专业委员会、自适应动态规划与强化学习专业委员会、青年工作委员会委员,IEEE计算智能学会暑期学校委员会主席,2022 IEEE Conference on Games Program Chair。
报告标题
基于博弈理论的强化学习
报告摘要
多智能体博弈决策过程中智能体之间的优化目标可以是共享协作的,也可以是完全对抗的。由于其它智能体策略的变化,任何一方智能体的强化学习都会面临非静态环境的影响,从而增加各方策略达到均衡点的难度。尤其是在完全对抗的博弈场景,任何一方在非纳什均衡点上所产生的次优误差都是不可忽略,甚至是决定性的。本报告从博弈论角度出来,介绍基于博弈理论的强化学习求解多智能体博弈决策问题的关键技术方法。在具有纳什收敛理论的学习方法基础上,针对大规模复杂场景设计具有更高学习效率的深度强化学习算法,最后在典型博弈对抗游戏上验证算法的效果,证明基于博弈理论的强化学习在解决复杂博弈决策问题上的优势。
第二场 20:00-21:00
报告人:陈赢峰
报告人简介
陈赢峰,网易伏羲机器人算法负责人。中科大博士毕业,网易伏羲实验室强化学习研究负责人。在校期间多次参加Robocup世界机器人大赛并获得2015年在巴西获得服务机器人组别世界冠军,参与中科大“可佳”, “佳佳”系列重点机器人项目。曾负责网易伏羲强化学习方向研究和落地,相关技术方案已经在多款网易游戏产品中落地并取得优异效果, 现致力于机器人学习算法的研究和落地。目前已在ICLR, NIPS, AAAI, IJCAI等人工智能顶会上发表论文30余篇。
报告标题
强化学习在体育类游戏AI的应用实践
报告摘要
强化学习算法已经在棋类、RTS以及Dota类游戏上取得了超越人类玩家水平的能力,突显出了巨大的潜力。体育类游戏作为一类具有很强竞技性和合作性的游戏玩法,非常适合强化学习以及多智能体算法的应用和研究。本报告将从实际的项目出发介绍如何利用强化学习和多智能体技术来打造满足不同需求的体育类游戏智能体, 同时也提出一些强化学习游戏AI的挑战和局限,以期共同研究和解决。
--
FROM 103.142.140.*