试验中要考察的指标称为试验指标,影响试验指标的条件称为因素,因素所处的状态称为水平,若试验中只有一个因素改变则称为单因素试验,若有两个因素改变则称为双因素试验,若有多个因素改变则称为多因素试验。方差分析就是对试验数据进行分析,检验方差相等的多个正态总体均值是否相等,进而判断各因素对试验指标的影响是否显着,根据影响试验指标条件的个数可以区分为单因素方差分析、双因素方差分析和多因素方差分析。
基本介绍
- 中文名:单因素方差分析
- 外文名:one-way analysis of variance
- 所属学科:数学(统计学)
- 相关概念:单因素试验,方差分析等
- 简介:单因素试验中的方差分析
基本概念
在方差分析中,我们将要考察的对象的某种特徵称为试验指标,影响试验指标的条件称为因素,因素可分为两类,一类是人们可以控制的(如原材料、设备、学历、专业等因素);另一类人们无法控制的(如员工素质与机遇等因素)。下面所讨论的因素都是指可控制因素。每个因素又有若干个状态可供选择,因素可供选择的每个状态称为该因素的水平。如果在一项试验中只有一个因素在改变,则称为单因素试验;如果多于一个因素在改变,则称为多因素试验。因素常用大写字母A,B,C,…来表示,因素A的水平用
来表示,下面对单因素试验进行讨论。

假设前提
设单因素A具有r个水平,分别记为
,在每个水平
下,要考察的指标可以看成一个总体,故有r个总体,并假设:


(1)每个总体均服从常态分配,即
;

(2)每个总体的方差σ2相同;
(3)从每个总体中抽取的样本
相互独立,i=1,2,…,r。

此处的
均未知,将假设及相关符号列表,如表1所示。

水平 | ![]() | ![]() | ![]() | ![]() |
样本 | ![]() | ![]() | ![]() | ![]() |
![]() | ![]() | ![]() | ![]() | |
![]() | ![]() | ![]() | ||
![]() | ![]() | ![]() | ![]() | |
样本和 | ![]() | ![]() | ![]() | ![]() |
样本均值 | ![]() | ![]() | ![]() | ![]() |
总体 | ![]() | ![]() | ![]() | ![]() |
总体均值 | ![]() | ![]() | ![]() | ![]() |
那幺,要比较各个总体的均值是否一致,就是要检验各个总体的均值是否相等,设第i个总体的均值为μi,则
假设检验为
;

备择假设为
不全相等。

在水平
下,进行
次独立试验,得到试验数据
,记数据的总个数为
。




由假设有
(
未知),即有
,故
可视为随机误差。记
,从而得到如下数学模型:









方差分析的任务:
(1)检验该模型中r个总体
的均值是否相等;

(2)作为未知参数
的估计。

为了更仔细地描述数据,常在方差分析中引入总平均和效应的概念,将
各均值的加权平均值
记为μ,即











而前述检验假设则等价于



这是因为若且唯若
时,
,即
。



偏差平方和及其分解
为了使造成各随机变数Xij之间的差异的大小能定量表示出来,引入:
记在水平Ai下样本和为
,其样本均值为
因素A下的所有水平的样本总均值为





如果H0成立,则r个总体间无显着差异,也就是说因素A对指标没有显着影响,所有的Xij可以认为来自同一个总体
,各个Xij间的差异只是由随机因素引起的,若H0不成立,则在总偏差中,除随机因素引起的差异外,还包括由因素A的不同水平的作用而产生的差异,如果不同水平作用产生的差异比随机因素引起的差异大得多,就认为因素A对指标有显着影响,否则,认为无显着影响。为此,可将总偏差中的这两种差异分开,然后进行比较。

记

定理1(平方和分解定理)令
,有


SE与SA的统计特性
如果H0成立,则所有的Xij都服从常态分配
,且相互独立,则有:

定理2
(1)
,且
,所以
为σ2的无偏估计;



(2)
,且
,因此
为σ2的无偏估计;



(3)SE与SA相互独立;
(4)
。
