- 计算样本协方差题目给出了A,B两组数据,要求他们的协方差。我的疑
- 题目给出了A,B两组数据,要求他们的协方差。我的疑问是最后到底是除以n,还是除以n-1?
- 除以n
首先,把这两组数据看做是二维随机变量(X,Y),
要求协方差cov(X,Y)
有公式cov(X,Y)=E{[X-E(X)]*[Y-E(Y)]}
=E(X*Y)-E(X)*E(Y)
又因为,求期望的表达式为E(X)=∑Xi*Pi
由于样本中元素较少,每个元素的概率可以看作相等,都为1/n
因此,E(X)=(∑Xi)/n
同理可得,E(Y)=(∑Yi)/n
E(X*Y)=(∑Xi*Yi)/n
最终结果为:
cov(X,Y)=(∑Xi*Yi)/n-(∑Xi)(∑Yi)/n2