在有限的二阶矩的情况下,两个共同分布的实值随机变数X和Y之间的协方差被定义为它们偏离各自期望值的期望乘积。但协方差的计算有多种形式,和定义的一般格式有所区别。
作图有误,应写为
cov(X,Y)=E(XY)-E(X)E(Y ) 被减数是没有逗号的
基本介绍
- 中文名:协方差
- 外文名:covariance
说到协方差的计算,首先看下统计学家对协方差的定义。

这里, 代表变数X的期望,一般可以理解为X的平均值。

根据协方差的线性推导,上述定义可以转化为下列形式:
计算公式(1)

这里,计算机计算时需要注意最后一个等式,这最后一个方程在计算浮点运算时容易发生灾难性的取消,因此应该避免这种情况。
计算公式(2)

计算公式二来自公式(1)的变形,公式(2)揭示了协方差的本质物理意义,也就是说协方差代表样本彼此差异的均值,详见
另外:需要注意,如果用协方差计算相关係数。协方差中的X,Y已经假设样本数据为全体数据的集合。此时,协方差公式中的标準差计算时,需要除以N而不是N-1。计算公式如下

当X为全体样本的数据时,标準差S的计算公式(3)
相关係数公式(4)