- 主题:有向量的协方差的概念吗?
普通的协方差就是两个随机变量偏离中心点的一致性(是否同时偏大和偏小), 而且这两个随机变量之间有某种顺序(关系)。
在高维中考虑这个概念,却发现统计书上似乎引入的是协方差矩阵,即考察每个向量分量之间的协方差,结果是一个矩阵。可是明明空间中的两个向量序列(每个元素都是一个向量),其偏离中心的方向的一致性是可以用内积来衡量的,可以很自然的将原来定义的协方差引入为两个向量的协方差,其结果是一个标量。
Cov(X,Y)=E((X-E(X))*(Y-E(Y)) 中间的乘号是内积
不知道有这样的概念吗?
--
修改:gnwd FROM 125.86.90.*
FROM 125.86.90.*
你这个是相关系数
【 在 Hihere 的大作中提到: 】
:
: 协方差有一个标准化的过程。
: 一个变量减去平均数,再除以它的标准差,进行标准化。
:
: 【 在 gnwd () 的大作中提到: 】
--
FROM 14.108.167.*
主贴的重点不是这个
是随机变量为向量时的协方差定义
【 在 Hihere 的大作中提到: 】
:
: 还有一个是两个随机变量之和/差的方差,与协方差有关。如果两个随机变量独立,协方差为零。
:
: 【 在 gnwd 的大作中提到: 】
: : 普通的协方差就是两个随机变量偏离中心点的一致性(是否同时偏大和偏小), 而且这两个随机变量之间有某种顺序(关系)。
--
FROM 14.108.167.*
还是不大一样
主要是概念上的区别。
比如平面上的N个点,要看他们是不是有线性形态,从样本协方差来算,构成的两个向量(这N个点的X坐标构成一个向量,Y坐标构成另一个)就是N维的空间的,计算出来的内积并不是两个N维随机向量的协方差(一会补充解释),只能叫做内积。如果是想要计算两个N维随机向量的协方差,如果不知道总体分布,那还得采样,一个随机向量有M个样本,每个样本都是N维向量,那这个时候,协方差怎么算呢?
或者这样问,三维空间中的若干样本点,怎么判断这些点看起来大概线性的呢?
【 在 Hihere @ [Mathematics] 的大作中提到: 】
:
: 相关系数表示的不就是两个标准化向量的夹角的余弦,
: 也就是他们的内积,也是他们的协方差?
:
: 【 在 gnwd 的大作中提到: 】
--
FROM 14.108.168.*
两组三维空间中的点,其协方差有定义吗?
【 在 Hihere @ [Mathematics] 的大作中提到: 】
:
: 实际上还是先标准化,再求内积。也就是求相关系数,或者进行线性回归,列回归方程,找决定系数。这两个向量的线性程度越高,相关系数就越高。
: 这个有现实意义。
: 因为一般两个随机向量。他们的单位大多是不一样。所以需要先统一到一个尺度上来,也就是进行标准化。
: 两个向量的内积与它们的夹角有关。但是因为这个夹角还取决于两个向量的模,所以只有在标准化以后才能用内积直接表示这个夹角,也就是相关性。
--
FROM 14.108.168.*
【 在 Hihere 的大作中提到: 】
: 你问的是三维空间……
: 再想想
: :
要不就是建模成线性回归
要不就是先(x1,y1,z1),(x2,y2,z2)内积,然后再累加其余点组的内积。就是我最开始写的那个公式。
Cov(X,Y)=E((X-E(X))*(Y-E(Y)) 中间的乘号是内积
但这个符号Cov(X,Y)一般被定义为协方差矩阵了。
--
修改:gnwd FROM 125.86.90.*
FROM 125.86.90.*