当前位置首页 > 百科> 正文

组距分组

2020-01-22 17:33:06 百科
组距分组

组距分组

组距分组是将全部变数值依次划分为若干个区间,并将这一区间的变数值作为一组。组距分组是数值型数据分组的基本形式。离散变数的整数值如果变动幅度较大,而且总体单位数N又很大,则也要进行组距分组。 在组距分组中,各组之间的取值界限称为组限,一个组的最小值称为下限,最大值称为上限;上限与下限的差值称为组距;上限与下限值的平均数称为组中值,它是一组变数值的代表值。

基本介绍

  • 中文名:组距分组
  • 外文名:Interval Grouping
  • 拼音:Zǔ jù fēn zǔ
  • 隶属:数理科学
  • 学科:统计学
  • 类别:数值型数据分组的基本形式

基本内容

组距分组是将全部变数值依次划分为若干个区间,并将这一区间的变数值作为一组。组距分组是数值型数据分组的基本形式。
在组距分组中,各组之间的取值界限称为组限,一个组的最小值称为下限,最大值称为上限;上限与下限的差值称为组距;上限与下限值的平均数称为组中值,它是一组变数值的代表值。
把所有数据分成若干组,每个小组的两个端点之间的距离(组内数据的取值範围)称为组距。

步骤

1. 确定组数。一组数据的组数一般与数据本身的特点及数据的多少有关。由于分组的目的之一是为了观察数据分布的特徵,因此组数的多少应适中。如组数太少,数据的分布就会过于集中,组数太多,数据的分布就会过于分散,这都不便于观察数据分布的特徵和规律。组数的确定应以能够显示数据的分布特徵和规律为目的。
2.确定各组的组距。组距是一个组的上限与下限的差,可根据全部数据的最大值和最小值(即极差)及所分的组数来确定,即组距=(最大值-最小值)/组数。
3.根据分组整理成频数分布表。

原则

採用组距分组时,需要遵循“不重不漏”的原则。“不重”是指一项数据只能分在其中的某一组,不能在其他组中重複出现;“不漏”是指组别能够穷尽,即在所分的全部组别中每项数据都能分在其中的某一组,不能遗漏。
为解决“不重”的问题,统计分组时习惯上规定“上组限不在内”,即当相邻两组的上下限重叠时,恰好等于某一组上限的变数值不算在本组内,而计算在下一组内。而对于连续变数,可以採取相邻两组组限重叠的方法,根据“上组限不在内”的规定解决不重的问题,也可以对一个组的上限值採用小数点的形式,小数点的位数根据所要求的精度具体确定。例如,对零件尺寸可以分组为10-11.99、12-13.99、14-15.99,等等。
在组距分组中,如果全部数据中的最大值和最小值与其他数据相差悬殊,为避免出现空白组(即没有变数值的组)或个别极端值被漏掉,第一组和最后一组可以採取“××以下”及“××以上”这样的开口组。开口组通常以相邻组的组距作为其组距。为了统计分析的需要,有时需要观察某一数值以下或某一数值以上的频数或频率之和,还可以计算出累积频数或累积频率。

套用

统计整理是对调查过程中得到的大量统计资料加工整理、汇总、列表的过程,处于统计工作的中间环节,起着承前启后的作用。编制组距变数数列是数据整理过程中的一个关键环节,它不仅直接影响统计资料整理的科学性和準确性,而且最终影响着统计分析结果的真实性。
声明:此文信息来源于网络,登载此文只为提供信息参考,并不用于任何商业目的。如有侵权,请及时联系我们:baisebaisebaise@yeah.net