报告主要内容是介绍了一个平台。大体对应美国DAPAR.具体技术都是maddpg什么的也没什么新鲜。
那啥,今天seminar的参加人员里面居然有人号称中国兵棋第一人
另一个消息是穆老师的博弈论讨论班每周四都有,会议号不变
还有马老师和穆老师合带的学生DYZ的这个工作,我之前的设想以为还能进一步简化,不过我对game theory的了解不够,我需要再学一点game theory才知道能不能按我的思路继续简化。DYZ的这个最终还是导致需要ficticious play来解,离我预想的解析解差的太远了。
马宏宾引的那篇1985年的文章,
https://link.springer.com/content/pdf/10.1007/BF00939144.pdf, 我扫了眼,太粗了。
其实就像我当时说的,这个地方不论是理论价值还是实用价值都极度显眼,然后了30多年居然一点能看的结果都没有,我觉得更可能的是美国把一些重要理论结果压着不允许发表。
刚才结束了我才想起来,马宏宾老师在新加坡做的那个仿真,那个扭麻花的pattern,用harmonic game来解释就对了。控制和博弈论的结合,我记得程代展有potential game control的结果,但是不知道harmonic game会出什么结果。什么时候有时间看看系统所他们到底把博弈论玩成什么样子了。程代展给的结果必然都是解析的。
此外,最后DYZ问的那个问题,几个老师的回答,显然大家都不是game theory专家。我记得deepmind最近两年有一个结果,判断rl在harmonic game能不能收敛到真值,有个条件来着。忘了。
先这样。预定一个小时的报告,最后用了2个半。
【 在 vinbo 的大作中提到: 】
: Speaker:
: 邓向阳
: Inviter:
: ...................
--
修改:vinbo FROM 211.161.243.*
FROM 203.218.129.*