相关系数介于区间[-1,1]内。当相关系数为-1,表示完全负相关,表明两项资产的收益率变化方向和变化幅度完全相反。当相关系数为+1时,表示完全正相关,表明两项资产的收益率变化方向和变化幅度完全相同。当相关系数为0时,表示不相关。
若Y=a+bX,则有:
令E(X) = μ,D(X) = σ
则E(Y) = bμ + a,D(Y) = bσ
E(XY) = E(aX + bX) = aμ + b(σ + μ)
Cov(X,Y) = E(XY) − E(X)E(Y) = bσ
相关系数
相关表和相关图可反映两个变量之间的相互关系及其相关方向,但无法确切地表明两个变量之间相关的程度。于是,著名统计学家卡尔·皮尔逊设计了统计指标--相关系数(Correlation coefficient)。相关系数是用以反映变量之间相关关系密切程度的统计指标。相关系数是按积差方法计算,同样以两变量与各自平均值的离差为基础,通过两个离差相乘来反映两变量之间相关程度;着重研究线性的单相关系数。
依据相关现象之间的不同特征,其统计指标的名称有所不同。如将反映两变量间线性相关关系的统计指标称为相关系数(相关系数的平方称为判定系数);将反映两变量间曲线相关关系的统计指标称为非线性相关系数、非线性判定系数;将反映多元线性相关关系的统计指标称为复相关系数、复判定系数等。
缺点
需要指出的是,相关系数有一个明显的缺点,即它接近于1的程度与数据组数n相关,这容易给人一种假象。因为,当n较小时,相关系数的波动较大,对有些样本相关系数的绝对值易接近于1;当n较大时,相关系数的绝对值容易偏小。特别是当n=2时,相关系数的绝对值总为1。因此在样本容量n较小时,我们仅凭相关系数较大就判定变量x与y之间有密切的线性关系是不妥当的。
相关系数=分子:(x的值-x均值)*(y的值-y均值),再 累加求和
分母:n乘以x,y的标准差
又 标准差公式为:
即可得到化简之后的式子:
两个变量x,y的相关系数
分子为(xi-x平均数)*(yi-y平均数)多少个数,一起求和
分母为两个变量的标准差的乘积