从AB和AC的相关系数推导BC的相关系数范围

作者:
系列:头脑风暴

查看该系列所有文章

一个非常好的面试题。难度适中。

有三个随机变量 \( A\)\( B\)\( C\) ,已知 \( A\)\( B\) 之间的相关系数为 \( \rho\)\( A\)\( C\) 之间的相关系数也等于 \( \rho\) 。问 \( B\)\( C\) 的相关系数的取值范围。

1. 解答 1 :

\( A, B, C\) 之间的协方差矩阵必须是半正定的(反向而言,任何半正定的矩阵都可以作为某个联合正态分布的协方差矩阵)。

假设 \( x\)\( B\)\( C\) 的相关系数,我们事实上只需要解下面的方程即可求解 \( x\) 的范围:

$$\text{det}\left(\begin{array}{ccc}1&\rho&\rho \\ \rho&1&x\\ x&1&\rho\end{array}\right) \geq 0$$

这是一个关于 \( x\) 的二次方程 \( x^2-2p^2x-(2p^2-1)\leq 0\) ,直接得到 \( x\in [2\rho^2-1,1]\)

同样的方法还可以解决下面这个题目:已知 \( n\) 个随机变量,它们两两之间的相关系数都是 \( \rho\) ,求 \( \rho\) 的可能取值范围。

2. 解答 2 :

无妨假设 \( \text{var}(A)=1\)\( \text{var}(B)=1\)\( \text{var(C)}=1\) 。此时 \( B\)\( C\) 可以写成 \( A\) 和其它两个与 \( A\) 独立的随机变量的线性和:

$$\begin{array}{rcl}B&=&\rho A + \sqrt{1-\rho^2}B_1\\C&=&\rho A+\sqrt{1-\rho^2} C_1\end{array}$$

其中 \( B_1, C_1\) 都是与 \( A\) 独立的方差为 1 的随机变量。显然

$$\text{covar}(B_1,C_1)=\rho(B_1,C_1)\in[-1, 1]$$

从而:

$$\begin{array}{rcl}\rho(B,C) &=& \text{covar}(B,C) \\ &=&\text{covar}(\rho A + \sqrt{1-\rho^2} B_1,\rho A + \sqrt{1-\rho^2} C_1)\\ &=& \rho^2 \text{var}(A) + (1-\rho^2)\text{covar}(B_1,C_1) \\ &\in&[2\rho^2-1,1]\end{array}$$

3. 解答 3 :

如果我们将随机变量想象成多维空间里的向量,那么相关系数就是向量之间的夹角的 cos。也就是说 \( A\)\( B\)\( C\) 的夹角都是 \( \theta=\arccos\rho\)

从空间几何的角度看, \( B\)\( C\) 的夹角为 \( [0, 2\theta]\) ,所以 \( B\)\( C\) 的相关系数范围为 \( [\cos2\theta, \cos 0] = [2\rho^2-1,1]\)

Q. E. D.

系列: 头脑风暴 »
数学 » 悖论, 头脑风暴
最有名的关于换还是不换的问题是 三门问题 ,已经 被研究得比较透彻 。这里想说的是另外一个悖论。
这是一个老问题,最近有老同学问起,就在这里提一下吧。
编程 » Matlab
第一步, which 函数可用来获取 Matlab 函数的全路径(包含路径和文件名)。
小米路由器是小米最近推出的一款产品,其主要卖点是自带硬盘和迅雷下载。我买一个,已经用了一个星期,在这里说一下感受吧。