统计特徵统计学的基本概念之一在用数理统计方法研究总体时,人们所关心的实际上并非组成总体的各个个体本身。统计特徵有数量特徵和属性特徵之分,其中数量特徵又有计量特徵和计数特徵之分,数量特徵可以直接用数值来表示,例如,元件的大小尺寸、小麦的株高等均是计量特徵;而夏季暴雨的次数、一平方米布料上疵点的个数是计数特徵;属性特徵不能直接用数值来表示,如产品是否为合格品、每个人的性别等,特徵就是要考察的指标。
基本介绍
- 中文名:统计特徵
- 外文名:statistical characteristics
- 两大类型:差异性特徵、规律性特徵
- 主要特徵:极差、标準差、变异係数、众数等
- 特点:反映总体的各个个体间的分布情况
- 套用领域:统计学
定义
统计特徵是统计学的基本概念之一,在用数理统计方法研究总体时,人们所关心的实际上并非组成总体的各个个体本身,而主要是考察与它们相联繫的某个(或某些)特徵。研究有关特徵在总体的各个个体间的分布情况,称所要考察的特徵为总体的统计特徵。
无论是在空域,还是频域,在进行隐写分析时,除了使用一阶统计特徵之外,还可以使用共生矩阵,这时高阶统计特徵。灰度共生矩阵是分析空间关係的一种统计方法,当对图像中像素对中的分布进行统计时。
差异性特徵
极差
极差亦称为全距或误差範围,它是测定数据中最大值与最小值之差,说明数据的伸展情况。优点是计算简单,缺点是没有反映观测值离散情况。在相同实验次数下的两组数据,极差大的一组数据要比极差小的一组数据更为分散。
标準偏差
标準偏差也称为标準离差、标準差或均方差,它是衡量样本数据波动性(离散程度)的指标。标準偏差有两点不同于误差的平均值:①不必考虑误差的正、负号;②增强了大的误差数据的作用,所以能较好地反映测定数据的精密度,因此也用标準偏差来量度精密度。
标準偏差有两个重要的作用:
(1)测定研究对象变异程度的大小。变异程度就是各个数值相差的程度。其他条件相同,标準偏差大,变异程度大;标準偏差小,变异程度小。标準偏差的这种作用在比较两个或多个样本变异程度的大小上可以清楚地看出。
(2)作为量度误差的标準单位。标準偏差还可以作为检验不同样本是否有本质差别的标準单位。许多重要的统计方法,如显着性检验法,都是以标準偏差的套用作为基础的。
变异係数
标準偏差是反映样本数据的绝对波动状况。当测量较大的量值时,绝对误差一般较大:测量较小的量值时,绝对误差一般较小,因此,用相对波动的大小,即变异係数更能反映样本数据的波动性。
变异係数将有限次测定次数的标準偏差除以对测定值的平均值,得到一个相对值。标準偏差的单位与平均值相同,所以变异係数与测量的单位无关,是个纯数。
规律性特徵
算数平均值
算数平均值是一组数据集中位置最有用的统计特徵量,经常用样本的算数平均值来代表总体的平均水平。
中位数
在一组数据中,按其大小次序排序以排在正中间的一个数表示总体的平均水平,称之为中位数,或中值。平均值有时会因极值的影响而出现虚假的集中位置。人们把观测值按大小顺序排列,将排在中间的数称为中位数。观测次数为奇数时,中位数有1个;当观测次数为偶数时.中位数为中间两个数的平均值。例如某实验室的每天药品消耗的中位数为6瓶,物理学家用半衰期来衡量放射性同位数的衰变速度,用的就是放射性原子蜕变时间的中位数,如果要计算某种放射性原子蜕变所需时间的平均值,必须等所有原子蜕变完毕才有可能。显然,这是不能办到的,因为这需要漫长的时间。
众数
众数是指一组数据中,出现次数最多的变数值,众数不一定是平均值。例如,某实验室最近18天每天药品的消耗量分别为8,7,6,7,5,4,5.6,8,7,5,6,4,7,6,5,7,4瓶,7瓶出现次数最多,所以众数为7。