- 主题:EMD距离的一点问题
看EMD距离,有一点问题
signature里的bin与bin之间不存在距离的话
比如学生们成绩的分布
一班 a 65, b 70, c 80
二班 a 65, b 75, c 90
a与b,a与c,b与c 不存在距离
怎么理解这个问题
--
FROM 60.1.0.*
首先,什么是EMD
【 在 ZHMZFFL 的大作中提到: 】
: 看EMD距离,有一点问题
: signature里的bin与bin之间不存在距离的话
: 比如学生们成绩的分布
: ...................
--
FROM 223.72.94.*
也叫Wasserstein距离
【 在 yzjba 的大作中提到: 】
: 首先,什么是EMD
--
FROM 60.1.0.*
你的题干有错吧?
【 在 ZHMZFFL (ZHMZFFL) 的大作中提到: 】
: 也叫Wasserstein距离
--
FROM 121.207.83.*
好,我重新组织下语言
比如
图像分布好算,
[权重,像素坐标],
[权重,像素坐标],
[权重,像素坐标],
像素与像素之间的距离有实际意义,emd好算
学生们成绩的分布
一班成绩 a 65, b 70, c 80
[65,a?]
[70,b?]
[80,c?]
二班成绩 a 65, b 75, c 90
[65,a?]
[75,b?]
[90,c?]
学生a学生b这坐标是分项数据,不存在实际意义的距离
怎么算emd值?
【 在 zszqzzzf 的大作中提到: 】
: 你的题干有错吧?
:
--
修改:ZHMZFFL FROM 60.1.0.*
FROM 60.1.0.*
emd距离是两族数据搬运的最小距离。原始方法,就是列举所有可能,傻算,求最小的。
bin与bin之间不存在距离的话,数据搬运为0。
权重无论是多少,乘以0之和依然是0。
很拗口。
【 在 ZHMZFFL (ZHMZFFL) 的大作中提到: 】
: 好,我重新组织下语言
: 比如
: 图像分布好算,
: ...................
--
FROM 121.207.83.*
嗯,对学生成绩那例,我用独热编码
调用emd函数,算出来为恒定值
所以就上来问问,是不是不适合算那类数据
【 在 zszqzzzf 的大作中提到: 】
: emd距离是两族数据搬运的最小距离。原始方法,就是列举所有可能,傻算,求最小的。
: bin与bin之间不存在距离的话,数据搬运为0。
: 权重无论是多少,乘以0之和依然是0。
: ...................
--
FROM 60.1.0.*