它们可用来衡量两个变量之间的相关性的大小

用X、Y的协方差除以X的标准差*Y的标准差。是标准后的协方差

皮尔逊相关系数和斯皮尔曼等级相关系数

比较:

Untitled

皮尔逊相关系数

计算皮尔逊相关系数之前一定要做出散点图来看两组变量是否有线性关系

总体皮尔逊相关系数

Untitled

Untitled

样本皮尔逊相关系数

R = corrcoef(A,B) 返回两个随机变量 A 和 B (两个向量)之间的系数。

Untitled

绘制散点图判定两个数据对象之间的相关性:

Untitled

对相关系数大小的解释:

Untitled

注意:

  1. 变量本身线性关系的话,皮尔逊相关系数绝对值大的相关性强,小的相关性弱;

  2. 不确定两个变量是什么关系的情况下,即使算出皮尔逊相关系数如果发现很大,也不能说明两个变量线性相关,甚至不能说明它们相关,一定要画出散点图来看。