皮尔逊相关系数的介绍可参考维基百科:皮尔逊积矩相关系数
在统计学中,皮尔逊积矩相关系数(Pearson product-moment correlation coefficient,又称作 PPMCC或PCCs, 文章中常用r或Pearson’s r表示)用于度量两个变量X和Y之间的相关程度(线性相关)
两个变量的总体相关系数定义为两个变量之间的协方差与标准差的商
估算样本的协方差和标准差,可得到样本相关系数
r 亦可由样本点()的标准分数均值估算,得到与上式等价的表达式
其中分别是样本的标准分数、样本均值和样本标准差
总体和样本皮尔逊相关系数都小于或者等于1,可以由柯西-施瓦茨不等式证明,关于柯西-施瓦茨不等式的定义与证明具体可参考维基百科:柯西-施瓦茨不等式,下面将直接利用柯西-施瓦茨不等式来证明皮尔逊相关系数的绝对值小于1
证明:要证明式(1.2)中的r绝对值小于等于1即证明小于等于1,设式(1.2)中的,代入有
又由柯西-施瓦茨不等式知
由此可知式(1.4)中的,即,证毕!