Merge remote-tracking branch 'origin/master'
This commit is contained in:
10
README.md
10
README.md
@@ -11,6 +11,16 @@
|
|||||||

|

|
||||||
|
|
||||||
公式定义为: 两个连续变量(X,Y)的pearson相关性系数(Px,y)等于它们之间的协方差cov(X,Y)除以它们各自标准差的乘积(σX,σY)。系数的取值总是在-1.0到1.0之间,接近0的变量被成为无相关性,接近1或者-1被称为具有强相关性。
|
公式定义为: 两个连续变量(X,Y)的pearson相关性系数(Px,y)等于它们之间的协方差cov(X,Y)除以它们各自标准差的乘积(σX,σY)。系数的取值总是在-1.0到1.0之间,接近0的变量被成为无相关性,接近1或者-1被称为具有强相关性。
|
||||||
|
|
||||||
|
_皮尔森相关系数反映了两个变量的线性相关性的强弱程度,r的绝对值越大说明相关性越强。_
|
||||||
|
|
||||||
|
|
||||||
|
- 当r>0时,表明两个变量正相关,即一个变量值越大则另一个变量值也会越大;
|
||||||
|
- 当r<0时,表明两个变量负相关,即一个变量值越大则另一个变量值反而会越小;
|
||||||
|
- 当r=0时,表明两个变量不是线性相关的(注意只是非线性相关),但是可能存在其他方式的相关性(比如曲线方式);
|
||||||
|
- 当r=1和-1时,意味着两个变量X和Y可以很好的由直线方程来描述,所有样本点都很好的落在一条直线上。
|
||||||
|
|
||||||
|
|
||||||
通常情况下通过以下取值范围判断变量的相关强度:
|
通常情况下通过以下取值范围判断变量的相关强度:
|
||||||
相关系数 0.8-1.0 极强相关
|
相关系数 0.8-1.0 极强相关
|
||||||
0.6-0.8 强相关
|
0.6-0.8 强相关
|
||||||
|
|||||||
Reference in New Issue
Block a user