水木社区手机版
首页
|版面-力学(Mechanics)|
新版wap站已上线
展开
|
楼主
|
同主题展开
|
溯源
|
返回
上一篇
|
下一篇
|
同主题上篇
|
同主题下篇
主题:Re: 强化学习发现矩阵乘法算法!DeepMind登Nature封面,用 AI
vinbo
|
2022-10-11 14:14:36
|
这个结果的意义远不止一个矩阵乘法和数值计算。最精髓的地方在于如何把一个非马尔科夫决策过程化成马氏决策过程,比方本文原题目是一个纯代数计算,或者之前我见过一个RL设计电路板走线,等等。把任何想解决的问题,想办法化成序列决策游戏,然后设计适当的reward function,然后问题就可以认为被解决了。但是这是大方向,细节就没这么简单了,deepmind又给大家做了一个例题。
【 在 vinbo 的大作中提到: 】
:
https://mp.weixin.qq.com/s/WfFO-0aTZoKq99BxqVXWaA
: 然后deepmind给出了解读
:
https://www.Y.com/watch?v=3N3Bl5AA5QU
: ...................
--
FROM 211.161.249.*
上一篇
|
下一篇
|
同主题上篇
|
同主题下篇
选择讨论区
首页
|
分区
|
热推
BYR-Team
©
2010.
KBS Dev-Team
©
2011
登录完整版