是的,说实话数据驱动模型大部分情况需要大数据,特征抽取足够多(也就是他列举的干货种类繁多),结合他的优化函数(五绝排名),才能学出来些有用的权重。而且数据量大时,线性拟合不一定好用了,可能需要用到高阶模型。
然而,本身优化函数只有五个点的话,很容易过拟合。所以,对于一个研究对象是史上前几十球员的排名,特征仅有十多条,矩阵球员数乘特征(干货)数不超过几百,这个就属于小数据了。没准专家模型更有用。这时候就未必需要迷信于他的优化函数(五绝排名)了。哪怕他拍着胸脯说,我这个权重就是合理的,理由如下blabla。不用管是否符合五绝排名,那也不失为一种办法。
【 在 ly2012 的大作中提到: 】
: 数据驱动的模型需要保证一定的样本量,和无偏性,如果不能,专家模型(也就是利用人类知识)是个可行的替代方案。不过此时谁好谁坏可能需要一个大致的评判标准。不能过分迷信自己的经验,也不能过于迷信数据驱动的模型。
:
:
: ....................
- 来自「最水木 for iPad Pro (10.5-inch)」
--
FROM 67.183.156.*