首先得明确模型性能关注的点有哪些;
其次,这个分割的份数太少,最好多做几次,比如100次
再次,在这多次循环分割的训练和验证基础上,选择训练集和验证集的性能差异比较接近的那些切分组合,将其中统计效果最显著而性能差异较小的训练结果作为建模结果就行。
【 在 MicroSat 的大作中提到: 】
: 问一个cross validation的问题。
: 假设是5折 cross validation。k=5.
: 把样本分割成5份,a1,a2,a3,a4,a5
: ...................
--
FROM 115.171.222.*