四分位差

四分位差(quartile deviation),它是上四分位数(Q3,即位于75%)与下四分位数(Q1,即位于25%)的差的一半。
计算公式为:Q =(Q3-Q1)/2
四分位差反映了中间50%数据的离散程度,其数值越小,说明中间的数据越集中;其数值越大,说明中间的数据越分散。四分位差不受极值的影响。此外,由于中位数处于数据的中间位置,因此,四分位差的大小在一定程度上也说明了中位数对一组数据的代表程度。四分位差主要用于测度顺序数据的离散程度。对于数值型数据也可以计算四分位差,但不适合分类数据。
四分位数是将一组数据由小到大(或由大到小)排序后,用3个点将全部数据分为4等份,与这3个点位置上相对应的数值称为四分位数,分别记为Q1(第一四分位数),说明数据中有25%的数据小于或等于Q1,Q2(第二四分位数,即中位数)说明数据中有50%的数据小于或等于Q2、Q3(第三四分位数)说明数据中有75%的数据小于或等于Q3。其中,Q3到Q1之间的距离的差的一半又称为分半四分位差,记为(Q3-Q1)/2。
- 中文名称 四分位差
- 外文名称 quartile deviation
- 概念 长度
- 计算公式 Q = (Q3-Q1)/2
计算方法
如果所给的数据资料不同,四分位差的具体计算方法也不同:
- 1.未分组数据
首先对数据进行排序,求出Ql、Q3所在的位置;其次根据位置确定其对应的标志值即Ql、Q3;最后计算二者差额的一半,即就是四分位差。
Ql的位置= (n + 1) / 4
Q3的位置= 3*(n + 1) / 4
- 2.单项式数列
先计算各组的累计次数,然后确定分位点位置。
Ql的位置= Σf / 4
Q3的位置= 3 * Σf / 4
对于上面的两种情况,若(n+1)或Σf恰好为4的倍数,则计算出来的四分位数的位置就是整数,这时,各个位置上的变量值就是相应的四分位数;若(n+1)或Σf不是4的倍数,则按上面公式计算出来的四分位数的位次就可能带有小数,这时可根据插值法来计算上下四分位数。再按公式计算出四分位差。
假设样本容量为50时,=12.75,=38.25,则按插值法可得:
整理得:Q1=0.25X12+0.75X13
同样可得:Q3=0.75X38+0.25X39
- 3.组距式数列
先计算上、下四分位的值,然后再计算四分位差。此时计算四分位数的基本原理与中位数相类似。计算公式如下:
式中,,,分别代表下四分位和上四分位数所在组的下限;,分别代表下四分位和上四分位数所在组以下的累计次数;,分别代表下四分位和上四分位数所在组的次数。
计算案例
例1:由7人组成的旅游小团队年龄分别为:17、19、22、24、25、28、34,求其年龄的四分位差。计算步骤为:
①计算Q1,与Q3的位置。
Q1的位置= (n + 1) / 4 = (7 + 1) / 4 = 2
Q3的位置= 3*(n + 1) / 4 = 3*(7 + 1) / 4 = 6
即Q1与Q3的位置分别为第2位和第6位。
②确定Q1与Q3的数值。
Q1=19(岁)
Q3=28(岁)
即第2位和第6位对应年龄分别为19岁和28岁。
③计算四分位差。
Q.D.=Q3 − Q1=28-19=9(岁)
④含义。说明该旅游小团队有50%的人年龄集中在19~28岁之间,最大差异为9岁。
例2:根据某车间工人日产量分组资料,如表1所示,计算四分位差。
按日产量分组(个) | 工人数f(人) | 向上累计工人数F(人) |
5~10 | 12 | 12 |
10~15 | 46 | 58 |
15~20 | 36 | 94 |
20~25 | 6 | 100 |
合计 | 100 | -- |
计算步骤为:
①确定Q1与Q3的位置。
Q1的位置= Σf / 4 = 100 / 4 = 25
根据向上累计工人数可知Q1在第2组即10~15内。
Q3的位置= 3 * Σf / 4 = 3* 100 / 4 = 75
根据向上累计工人数可知,Q3在第3组即15~20内。
②计算Q1与Q3的数值。
③计算四分位差。
Q.D.=Q3-Ql=17.4-11.4=6(个)
④含义。计算结果表明,有50%(一半)工人的日产量分布在11.4~17.4之间,且最大差异为6个。
四分位差的优点表现为不受两端各25%数值的影响,能对开口组数列的差异程度进行测度,可以衡量中位数代表性高低。缺点为不能反映所有标志值的差异程度。