kendall秩相关系数

kendall秩相关系数(R)是指设有n个统计对象,每个对象有两个属性的系数。将所有统计对象按属性1取值排列,不失一般性,设此时属性2取值的排列是乱序的。设P为两个属性值排列大小关系一致的统计对象对数。则:
R=(P-(n*(n-1)/2-P))/(n*(n-1)/2)=(4P/(n*(n-1)))-1
- 中文名称 kendall秩相关系数
- 同序对 concordant pairs
- 异序对 discordant pairs
- 系数为1 两个属性正相关
基本定义
Kendall(肯德尔)系数的定义:n个同类的统计对象按特定属性排序,其他属性通常是乱序阀连轿档的。同序对(concordant pairs)和异序对(discordant pairs)之差与总对数(n*(n-1)/2)的比值定义为Kendall(肯德尔)系数。
属性
1)如果两个属性排名是相同的,系数为1 ,两个属性正相关。
2)如果两个属性排名完全相反,系数为-1 ,两个属性负相关。
3)如果排名是完全独立的,系数为0。
例子
假如我们设一组8人的身高和体重在那里A的人是最高的,第三重,等等:
Person | A | B | C | D | E | F | G | H |
Rank by Height | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 |
Rank by Weight | 3 | 4 | 1 | 2 | 5 | 7 | 8 | 6 |
我们看到,有一些相关的两个排名之间的道页格相关性,可以使用她愚夜肯德尔头系数,客观地衡量拒主厦对应。
注意,A最高,但体重排名为 3 ,比体重迎微排名为 4,5,6,7,8 的重,贡献5个同序对,即AB,AE,AF,AG,AH。同理,我们发现B、C、记充叠拳精试榜D、E、F、G、H分别贡献4、5、4、3、1、0、0个同序对,因此,同序对数
P = 5 + 4 + 5 + 4 + 3 + 1 + 0 + 0 = 22.
异序对数 Q=28-22 (总对数减去同序对数为异序对数)
因而R=((22-6)/28)=0.57。这一结果显示出强大的排名之间的规律,符合预期。