专家模型是没有你说的优化函数的,就是凭知识来挑变量给权重,然后出结果。囧纳尔可能是这样做的,然后发现得到的排名与某个排名有些相似,因而觉得可以。如果他是以某某为目标调权重甚至变量,那就是两相结合了。我不知道他是哪一种。
十几个特征几十个样本,这是很容易过拟合的呀,样本量相对与于变量太少了
【 在 h2929 的大作中提到: 】
: 是的,说实话数据驱动模型大部分情况需要大数据,特征抽取足够多(也就是他列举的干货种类繁多),结合他的优化函数(五绝排名),才能学出来些有用的权重。而且数据量大时,线性拟合不一定好用了,可能需要用到高阶模型。
: 然而,本身优化函数只有五个点的话,很容易过拟合。所以,对于一个研究对象是史上前几十球员的排名,特征仅有十多条,矩阵球员数乘特征(干货)数不超过几百,这个就属于小数据了。没准专家模型更有用。这时候就未必需要迷信于他的优化函数(五绝排名)了。哪怕他拍着胸脯说,我这个权重就是合理的,理由如下blabla。不用管是否符合五绝排名,那也不失为一种办法。
:
: ...................
--
FROM 123.150.182.*