- 主题:哪位大侠对聚类方法比较了解吗?指导下
一共300多个样本,分成A B C三类,
每类数量至少10个以上时候,聚类结果比较准确。
但是如果其中两类可能数量很少,
比如A 只有1个, B只有1个,C将近300个,这种情况k均值聚类就结果不对。
肉眼看三类数据分布,是很明显的区别。
用什么招能解决下?
--
FROM 36.23.192.*
看看特征工程
【 在 hitmanman 的大作中提到: 】
: 一共300多个样本,分成A B C三类,
: 每类数量至少10个以上时候,聚类结果比较准确。
: 但是如果其中两类可能数量很少,
: ...................
--
FROM 202.106.10.*
基于密度的聚类试试
【 在 hitmanman (Adam) 的大作中提到: 】
: 一共300多个样本,分成A B C三类,
: 每类数量至少10个以上时候,聚类结果比较准确。
: 但是如果其中两类可能数量很少,
: ...................
--
FROM 182.92.253.*
birch效果不错
可以容忍1个得情况
多谢哈哈
【 在 Jangbi 的大作中提到: 】
: 基于密度的聚类试试
:
--
FROM 36.23.192.*
特征选择的问题。
【 在 hitmanman 的大作中提到: 】
: 一共300多个样本,分成A B C三类,
: 每类数量至少10个以上时候,聚类结果比较准确。
: 但是如果其中两类可能数量很少,
: ...................
--
FROM 123.150.181.*
换一个聚类方法搞定了
根据前面回复的启发
谢谢大家
【 在 wangychf 的大作中提到: 】
: 特征选择的问题。
--
FROM 36.23.192.*
肉眼很清楚的聚类不是随便做么……
【 在 hitmanman (Adam) 的大作中提到: 】
:
:
: 一共300多个样本,分成A B C三类,
: 每类数量至少10个以上时候,聚类结果比较准确。
--
FROM 115.199.182.*
实际情况千差万别
【 在 touzi 的大作中提到: 】
: 肉眼很清楚的聚类不是随便做么……
--
FROM 115.205.166.*