alpha zero和alpha go没本质区别...两者在框架和参数规模上都是一样的。
两者唯一的区别就是alpha go master版本刚开始用人类棋谱学习,之后才自我对弈提升。而zero版本一开始就从自我对弈开始。
master如果持续自我对弈下去,也是会超越停止进化的zero的。说的更简单一点,master和zero的区别,仅仅在于进化过程中喂的养分的区别。以此证明了喂养人类棋谱对进化速度起了反作用,仅此而已...
至于gpt,现在chatgpt确实没形成闭环,你可以说它还不会进化。
但现在gpt plugin出来了,已经不能再这么说了。
【 在 Oriphia 的大作中提到: 】
: 当然不是这样,创造性的AI指是Alpha Zero,而不是Alpha Go。
: Go学习的人类棋谱的,没有自学习能力,所以只能分析人类棋谱中哪种下法的胜率更高,只能汰劣,而没有创新,比如17年之前初级小目定式里有间一高(低)挂和间二高(低)挂四级布局,后2种下法GO计算胜率认为-10%~20%,所以后2种定式被GO淘汰。
: ZERO是有自学习能力的,等于在现有规则下重新发明了一次围棋,比如星位定式白棋点三三,这手在人类棋谱里是没有出现的,以前一直认为是对白棋不利,ZERO则认为是五五开可以接受。
: ...................
--
修改:lvsoft FROM 180.158.56.*
FROM 180.158.56.*