【 以下文字转载自 NewExpress 讨论区 】
发信人: acseed (advanced CS EE department), 信区: NewExpress
标 题: 用AI训练的成功思路详述老祖宗文化比西方的优秀之处
发信站: 水木社区 (Thu Mar 16 08:00:13 2023), 站内
我们的老祖宗们早就认识到世界是复杂的,而复杂的世界其实是很难用简单的道理来进行描述的。
所以我们的老祖宗们找到了另外一种方式来获取知识,这种方式有别于西方的数理逻辑,而是采用了目前最先进的建立大数据模型的方式,就是拼命的收集数据训练他们的大脑,并等待知识的自然“涌现”。
比如说星象学,我们的老祖宗们自古就不断的夜观天象,每天记录各种星辰变化,再记录下各种天下大事,如此坚持,久而久之,就能形成一个庞大的数据集。
然后,他们再不断的在此基础上做出各种预测,并用事后的经验来修正预测,这就是进行模型训练。
如此反复的训练几千年下来,预测结果的准确率自然就得到不断的提升。
你看,这和现在的AI算法有什么区别,其实AI也不懂得为啥有的图片上有猫,有的没有,但是训练多了,它自然就能准确的找出猫来。
所以,我们老祖宗获得知识的方法是和西方世界截然不同的,西方人都搞逻辑推理,数学计算那一套,那是捷径,但是我们老祖宗不走那条路,他们就是认认真真,踏踏实实的建立模型。
比如相面算命,就是建立长相和性格命运之间的模型,而占卜则是建立乌龟壳的高温随机裂纹和未来事件之间的模型。
中医也是如此,就是建立一个人体各种生理特征和自然药物组合之间的模型,甚至建立和语义学之间的模型。
当然,这个建立模型的过程自然是很漫长也很辛苦的,而且甚至有些无厘头。这就和我们现在去观察一个AI的训练过程一样,在训练量不足的时候它们也会做出很多错误的判断,比如不知道一颗树上被打死一只鸟后应该还剩几只,但是这是一个必然要经历的改进过程。
当训练量逐渐变大之后,模型的判断就会越来越准确了,你就会看到知识开始自动的“涌现”出来了。
坚持这样做,这让我们的老祖宗们获得了一种神奇的超越逻辑力量的奇妙知识,这些知识的神奇之处就和现在AI模型的能力是一样的:你知道它有效,但是你不知道它为什么有效,它自己也说不出来它是怎么有效的,反正就是有效。
可能,一切都归因于混沌理论中的涌现效应(Emergence effect):当一个复杂系统复杂到一定程度的时候,就会自发出现无法解释的智能现象。
从这个角度出发,很多我们现在不能理解的事情也可以解释了。
为什么古人老喜欢说:祖宗之法不可变?
这听起来似乎非常守旧,但是这不就是为了维护模型训练的稳定性吗,如果模型数据还在积累的时候就改变算法,岂不是之前先辈积累的数据就浪费了?
其实建立数据模型的关键不在于算法多么先进,现在火爆的chatGPT,它的算法和之前的语言模型差别也没有那么大,而它这么聪明的原因就是因为参数量级上远远超越了其他模型。
所以,关键是数据的稳定积累,只有数量才是涌现的关键!
另外,为什么古代中国历朝历代似乎都不喜欢跟外来文化过度交流,动不动就闭关锁国,禁商禁海?说白了,这还不是为了维护核心数据不被污染吗?
如果一个模型,在训练中不断的更新数据,都会严重影响模型的准确性,并且导致模型被一些不可靠的数据影响。对于如此超超大规模的训练计划,任何训练数据自然都必须是要来源于经过长期沉淀验证后的可靠资料,可不能随便乱喂数据。
所以同样道理,现在chatGPT的数据同样只用限期范围的数据,而且不提供在线更新,就是基于同样原因。
你看,现在西方人也知道这些道道了,只可惜他们现在在这方面的研究还太少了,而且他们还是期望用严谨的数学方法来搞明白这些事情。
要我说,这是徒劳的。
混沌系统的关键就在于要“混沌”,一想弄清楚就没效果了,你得足够的含糊才行,这种分寸只有懂得含蓄和内敛的东方人才能把握,那些什么都要弄个清楚的秉承希腊哲学的西方人是搞不明白的,他们完全不理解怎么把一件事情弄“浑”,完全不懂得什么叫“道不可道,名不可名”。
模型说到底是什么?难道只是一堆数字吗?
千亿级的海量数字纠缠在一起的复杂模型早就超出人类逻辑能力的极限了,这其中的复杂混沌现象是用任何数学公式都无法解读的。而我们的老祖宗老早就明白这个道理了,所以他们不研究逻辑,而是讲求“意境”,从中感悟“天道”,把提升境界当作智慧目标。
所以,模型大到如此规模,这种千万亿级的数据宇宙,它就是天地,就是万物,就是苍生。
而对于天地万物,只有用咱们中式文化的意境才能理解其中的天道何在,而训练量的多少则决定了你境界的高低,也就是最终模型的准确率。
所以,不要太妄自菲薄,中国其实早就诞生现代科学了,你看我们不是在前面等着人家么。
只不过呢,中国古代的这种知识获得方式相比于西方人的技术捷径来说确实显的有点缓慢迟钝了,这主要是因为建立模型需要的时间太长了,而且还有一个严重的问题是,每次训练好的模型,要从上一代人传给下一代人都需要耗费巨大的时间精力,而且训练出来的模型都只能用一种只可意会不可言传的方式慢慢传递给下一代人,往往还会造成大量的数据损耗,从而导致我们的知识总是在不断的往复徘徊,甚至更多训练出色的模型都因为传承不力而丢失了,比如上古巫术,符咒仙术,奇门遁甲等等,这不能不说是非常遗憾的事情。
不过要相信我们老祖宗们的超凡智慧,他们选择的是一条虽然走起来慢但是却真正长远的路,模型的积累区区几千年不过是个开始,未来漫长岁月,几千数万年下来就会看到从量变到质变的过程。
也许有一天,全人类也要依赖我们的人脑模型的判断,让人类在无比复杂的宇宙演化之中,找到一条走向未来之路:)
--
FROM 117.136.12.*