主成分分析。
利用降维的思想,把多指标转化为少数几个综合指标。
在统计学中,主成分分析(principal components analysis,PCA)是一种简化数据集的技术。它是一个线性变换。这个变换把数据变换到一个新的坐标系统中,使得任何数据投影的第一大方差在第一个坐标(称为第一主成分)上,第二大方差在第二个坐标(第二主成分)上,依次类推。
【 在 mahuta 的大作中提到: 】
: 版上各位巨佬们,求教一个问题:
: 已有5000个样本的数据集可用于训练和验证,每个样本有10000个特征单元,这10000个单元在同一样本内互不相同,但是在每个样本中均存在;每个单元的数值不是0就是1;每个样本的10000个单元的数值之和,即为这个样本的总数值。现在希望找出最优的一个由100个单元组成的组合,能
: 桓萑我谎灸谡100个单元中每一个的数值,预测出该样本的总数值。请问应该采用什么算法?
: ...................
--
FROM 112.47.70.*