一个非常好的面试题。难度适中。
有三个随机变量$ A$ 、$ B$ 、$ C$ ,已知$ A$ 和$ B$ 之间的相关系数为$ \rho$ ,$ A$ 和$ C$ 之间的相关系数也等于$ \rho$ 。问$ B$ 和$ C$ 的相关系数的取值范围。
1、解答 1 :
$ A, B, C$ 之间的协方差矩阵必须是半正定的(反向而言,任何半正定的矩阵都可以作为某个联合正态分布的协方差矩阵)。
假设$ x$ 为$ B$ 和$ C$ 的相关系数,我们事实上只需要解下面的方程即可求解$ x$ 的范围:
这是一个关于$ x$ 的二次方程$ x^2-2p^2x+(2p^2-1)\leq 0$ ,直接得到$ x\in [2\rho^2-1,1]$ 。
同样的方法还可以解决下面这个题目:已知$ n$ 个随机变量,它们两两之间的相关系数都是$ \rho$ ,求$ \rho$ 的可能取值范围。
2、解答 2 :
无妨假设$ \text{var}(A)=1$ ,$ \text{var}(B)=1$ ,$ \text{var(C)}=1$ 。此时$ B$ 和$ C$ 可以写成$ A$ 和其它两个与$ A$ 独立的随机变量的线性和:
其中$ B_1, C_1$ 都是与$ A$ 独立的方差为 1 的随机变量。显然
从而:
3、解答 3 :
如果我们将随机变量想象成多维空间里的向量,那么相关系数就是向量之间的夹角的 cos。也就是说$ A$ 和$ B$ 、$ C$ 的夹角都是$ \theta=\arccos\rho$ 。
从空间几何的角度看,$ B$ 和$ C$ 的夹角为$ [0, 2\theta]$ ,所以$ B$ 和$ C$ 的相关系数范围为$ [\cos2\theta, \cos 0] = [2\rho^2-1,1]$ 。
Q. E. D.