- 主题:衡量一组数据的离散程度问什么用方差?
而不是平均平均偏差,二者区别在哪里?
直观应该是平均偏差更容易想到啊
--
FROM 221.222.241.*
对于一组数据没有平均偏差一说,有的话那是0,这个统计只针对一组数据与真实数据间的统计关系,比如预测值与观测值之间的偏差,一般用平均绝对误差。方差,一般都是用均方差表示,指数据偏离中心的程度。
--
FROM 202.108.199.*
那衡量离散度为什么是每个数据的减去平均值的平方之和,再除以n;
而不是每个数据减去平均值的差的绝对值之和,再除以n?
【 在 weiminglake (weiminglake) 的大作中提到: 】
: 对于一组数据没有平均偏差一说,有的话那是0,这个统计只针对一组数据与真实数据间的统计关系,比如预测值与观测值之间的偏差,一般用平均绝对误差。方差,一般都是用均方差表示,指数据偏离中心的程度。
: --
:
:
--
FROM 221.222.241.*
平方可以放大偏离偏大的值,看得更明显一些呗
【 在 nmwan 的大作中提到: 】
: 那衡量离散度为什么是每个数据的减去平均值的平方之和,再除以n;
: 而不是每个数据减去平均值的差的绝对值之和,再除以n?
--
FROM 211.145.54.*
平方后对异常值的敏感度会更高,更容易衡量数据组的离散程度,同时在统计学方面如果要剔除异常值可以用3倍代尔塔准则,也就是三倍均方根准则,可使剔除后的数据在97%的置信区间内。
- 来自 水木社区APP v3.5.7
【 在 nmwan 的大作中提到: 】
: 那衡量离散度为什么是每个数据的减去平均值的平方之和,再除以n;
: 而不是每个数据减去平均值的差的绝对值之和,再除以n?
--
FROM 117.133.66.*
如果用平均绝对偏差统计,你没法分析置信区间,没法通过有说服力的量化标准挑出哪些是异常值。
- 来自 水木社区APP v3.5.7
【 在 weiminglake 的大作中提到: 】
: 平方后对异常值的敏感度会更高,更容易衡量数据组的离散程度,同时在统计学方面如果要剔除异常值可以用3倍代尔塔准则,也就是三倍均方根准则,可使剔除后的数据在97%的置信区间内。
: - 来自 水木社区APP v3.5.7
--
FROM 117.133.66.*
数学原因。
绝对值函数不光滑,存在不可导点。
会造成求极值不容易...
【 在 nmwan 的大作中提到: 】
: 那衡量离散度为什么是每个数据的减去平均值的平方之和,再除以n;
: 而不是每个数据减去平均值的差的绝对值之和,再除以n?
--
FROM 188.95.247.*
有道理,谢谢
【 在 weiminglake (weiminglake) 的大作中提到: 】
: 平方后对异常值的敏感度会更高,更容易衡量数据组的离散程度,同时在统计学方面如果要剔除异常值可以用3倍代尔塔准则,也就是三倍均方根准则,可使剔除后的数据在97%的置信区间内。
: - 来自 水木社区APP v3.5.7
: 【 在 nmwan 的大作中提到: 】
: : 那衡量离散度为什么是每个数据的减去平均值的平方之和,再除以n;
--
FROM 221.222.241.*
有道理,谢谢
【 在 nisus (恒久忍耐) 的大作中提到: 】
: 数学原因。
:
: 绝对值函数不光滑,存在不可导点。
: 会造成求极值不容易...
--
FROM 221.222.241.*
这个解释不了为什么不用四次方,但仍然谢谢
【 在 wuya5 (无牙) 的大作中提到: 】
: 平方可以放大偏离偏大的值,看得更明显一些呗
: 【 在 nmwan 的大作中提到: 】
: : 那衡量离散度为什么是每个数据的减去平均值的平方之和,再除以n;
: : 而不是每个数据减去平均值的差的绝对值之和,再除以n?
--
FROM 221.222.241.*