- 主题:奥卡姆剃刀与科学
先举个很简单的例子:请问 1,2,3,4,5,6,__,请问__处你填什么?
解决这个问题,我们首先要从数据里归纳出规律,提出假说,或者叫做理论,有许多理论(假说)都满足这个规律:
A理论说数据是由f(n) = n这个函数产生的;
B理论说数据是由 f(n) = (n-1)(n-2)(n-3)(n-4)(n-5)(n-6)+n这个函数产生的。
A和B两个理论都很好的解释了现象,A与B相比更加简单一些,根据奥卡姆剃刀原则,就应该接受A理论,抛弃B理论。按照A假说,应该填入7。
奥卡姆剃刀原则(Occam's Razor):如无必要,勿增实体。
据罗素考证,生于13世纪左右的神学家与逻辑学家威廉o奥卡姆并没有说过 “如无必要,勿增实体。”但他却说了一句差不多效果的话:“能以较少者完成的事物,若以较多者去做即是徒劳。”顺便说一句,这个原理是奥卡姆参与当时的哲学界唯名论与唯实论之战中提出的。后来科学家在解释世界的规律的时候发现,同时有几个理论都可以解释经验数据的时候,无法抉择,于是搬出奥卡姆剃刀原则,选择实体较少的那个,或者说相对简单的那个理论。也就是说,如果用不着某种假设的实体来解释某一事物,那么我们就没有理由去假设它。伽利略、爱因斯坦等物理学家也支持类似的简单化(简约,也有叫吝啬)原则,爱因斯坦曾经说:“一切都应该尽可能地简单,但不能比这更简单。”比如说如果人的意识最终可被科学解释为脑神经细胞的产物,那么就没有必要引入独立的灵魂了。领悟了“如无必要勿增实体”原则的大妈可能回家就把老公给踢飞了。
由于这只是一个哲学原则,什么是实体,什么叫必要,不同的学科的科学家给出的解释可能不同,这些概念也需要转换为可量化可比较的,比如机器学习里的最小描述长度理论比较两个模型的解释能力以及复杂度。在机器学习任务中,可以通过减小模型的复杂度来降低过拟合的风险,即模型在能够较好拟合训练例子的前提下,尽量减小模型的复杂度,但也不能过于简单(Bias Variance tradeoff:模型过于简单时,容易发生欠拟合(high bias);模型过于复杂时,又容易发生过拟合(high variance),需要在bias与variance间找寻一个平衡)。
如果再深入思考一下,为什么在都能解释经验数据的情况下,人们偏向于选择简单的模型呢,是因为人们觉得,更简单的模型是巧合的概率更小,所以简单的模型更有可能反映了所研究事物的内在规律。托马斯o阿奎那就说:“如果通过一种手段就能完成某事,用几种手段去做就是多余,因为我们观察到,在一种手段足够的情况下,大自然不会使用两种手段。”。你是不是觉得挺扯的,所以说奥卡姆剃刀只是一种经验性的原则,它并不能决定一个理论的对错。
比如说开头的那个例子,从数字里归纳规律,1,2,3,4,5,6, __,__处依据A理论应该填7,依据B理论应该填入727,也许真实的规律就是B呢。所以说科学里的很多理论其实只是归纳出来的假说而已,归纳法只适用于以往的经验数据,对于未来的预测是不能保证一定是正确的。科学其实是构建在一些不可保证为必然正确的假设的基础上的,在某种程度上来说,信科学并不比信宗教信占星术高大上,科学本质上也是一种信仰。那么你为什么信科学而不信其他的,是因为,依据我们的经验,在预测未来正确性与具体明晰性等方面,科学比它的对手靠谱实用的多。
除了奥卡姆的剃刀,还有一把牛顿的烈焰激光剑(Newton’s Flaming Laser Sword),大意是这样的:所有不能进行实验和观测的东西都不值得辩论。这条比较适合科学界,这一剑就不仅能斩杀99%的民科,还可以斩杀对课题的科学可操作性不能正确把握的博导硕导了。其实哲学界的维特根斯坦也说过类似的:凡是能够言说的,都能说得清楚;对于不可言说之物,必须保持沉默。不过科学跟哲学的不同之处是科学讲究可操作性,聚焦于可测量可实验的研究问题,这样就不可避免的回避了一些有趣的本质性问题(这些问题留给了哲学家),这也是我认为的科学只是在比较肤浅的探索着这个世界。其实这也是没有办法的事情,人太渺小了,人的认知太有限度了。但是我们,是由经过了几十亿年的漂泊的尘埃,各种机缘巧合,最后聚集成能感知能力的生物,从而有了深入的领略这个有趣的世界能力,生而为人,这是何等的幸运,何等的欣喜!
@missmoody @waytogo
--
修改:hut FROM 183.212.115.*
FROM 183.212.115.*
毫无意义的小学生帖子
【 在 hut 的大作中提到: 】
: 先举个很简单的例子:请问 1,2,3,4,5,6,__,请问__处你填什么?
: 解决这个问题,我们首先要从数据里归纳出规律,提出假说,或者叫做理论,有许多理论(假说)都满足这个规律:
: A理论说数据是由f(n) = n这个函数产生的;
: ...................
--
FROM 223.104.215.*
怎么办 很晕很晕。。。。
--
FROM 113.46.164.*
且看我怎么把这个毫无意义
的小学生帖子变成艺术作品
主要使用的技法是拼贴,等
我吃完烤肉就把哈特牛逼哄
哄的话全部粘过来评论这篇
【 在 hut 的大作中提到: 】
: 先举个很简单的例子:请问 1,2,3,4,5,6,__,请问__处你填什么?
: 解决这个问题,我们首先要从数据里归纳出规律,提出假说,或者叫做理论,有许多理论(假说)都满足这个规律:
: A理论说数据是由f(n) = n这个函数产生的;
: ...................
--
FROM 223.104.215.*
我小学三年级就会这些了
你这么大个人了搞这些不
害臊嘛,鸡兔同笼不研究了?
【 在 hut 的大作中提到: 】
: 先举个很简单的例子:请问 1,2,3,4,5,6,__,请问__处你填什么?
: 解决这个问题,我们首先要从数据里归纳出规律,提出假说,或者叫做理论,有许多理论(假说)都满足这个规律:
: A理论说数据是由f(n) = n这个函数产生的;
: ...................
--
FROM 223.104.215.*
这个不是方数年之前就科普过的吗?
--
FROM 114.253.237.*
那赶紧吃,等着看呢
【 在 woobyone 的大作中提到: 】
: 且看我怎么把这个毫无意义
: 的小学生帖子变成艺术作品
: 主要使用的技法是拼贴,等
: ...................
--
FROM 114.253.237.*
膜拜哈特!
【 在 hut 的大作中提到: 】
: 先举个很简单的例子:请问 1,2,3,4,5,6,__,请问__处你填什么?
: 解决这个问题,我们首先要从数据里归纳出规律,提出假说,或者叫做理论,有许多理论(假说)都满足这个规律:
: A理论说数据是由f(n) = n这个函数产生的;
: ...................
--
FROM 125.120.230.*
五百万你这个死稳拿,你小穴三年级就会bias-variance tradeoff你咋不上天呢
【 在 woobyone 的大作中提到: 】
: 我小学三年级就会这些了
: 你这么大个人了搞这些不
: 害臊嘛,鸡兔同笼不研究了?
--
修改:zhuxiaozhu FROM 125.120.230.*
FROM 125.120.230.*
老大,上午写的一首小诗送给你:
闲卧竹榻上,山风送清凉。
遥看星河起,再读诗两行。
尘埃精灵随风舞,飞越竹林去荷塘。
塘中绿荷叶田田,谁家少女夜采莲?
【 在 hut 的大作中提到: 】
: 先举个很简单的例子:请问 1,2,3,4,5,6,__,请问__处你填什么?
: 解决这个问题,我们首先要从数据里归纳出规律,提出假说,或者叫做理论,有许多理论(假说)都满足这个规律:
: A理论说数据是由f(n) = n这个函数产生的;
: ...................
--
FROM 223.104.106.*