按照机器学习理论 样本太大容易过拟合
本质问题是训练用的样例是否与未见过的测试样例同质
科学领域的预测问题里面有一个根本性假设
就是假设过去的经验能推广到未来
(这就是归纳问题,也是我说科学不靠谱,科学其实也是一种信仰的原因)
这蕴含着未来的新问题与已经遇到过样例问题结构是差不多的
谁能保证新问题跟解决过的老问题一样呢
套在楼主的主题上
如果以高考成绩来推测人生成功率
其实是假设了:
高考分数或者说通过高考训练到的能力与人生成功所需要的素质是匹配的
这个假设正确的基础的话 预测才能成立
【 在 mean2010 的大作中提到: 】
: 样本量太小容易过拟合
: 你让他做十万套卷子
--
FROM 183.212.115.*