一个数据集,和一个模型算法(我们假设是svm), 用5-fold cross-validation后给出的最后性能到底是什么性能?
因为,如果这个数据集,分成5fold,那么就会有5个子数据集, 每个子数据集中都有80%的训练数据和20%的测试数据。
一个子数据集,进行机器学习,会有1)训练集合的性能,和2)测试集合的性能。
5个子数据集,我们就会有5个训练集合的性能,和5个测试集合的性能。
请问,最后报告的是哪个性能呢?
如果是平均,那么如何平均呢?
--
FROM 129.120.103.*