方差分析(ANOVA)
一、方差分析的基本思想
1. 方差分析的概念
方差分析(ANOVA)又称变异数分析或F检验,其目的是推断两组或多组资料的总体均数是否相同,检验两个或多个样本均数的差异是否有统计学意义。我们要学习的主要内容包括单因素方差分析即完全随机设计或成组设计的方差分析和两因素方差分析即配伍组设计的方差分析。
2. 方差分析的基本思想
下面我们用一个简单的例子来说明方差分析的基本思想:
如某克山病区测得11例克山病患者和13名健康人的血磷值(mmol/L)如下,
患者:0.84 1.05 1.20 1.20 1.39 1.53 1.67 1.80 1.87 2.07 2.11
健康人:0.54 0.64 0.64 0.75 0.76 0.81 1.16 1.20 1.34 1.35 1.48 1.56 1.87
问该地克山病患者与健康人的血磷值是否不同?
从以上资料可以看出,24个患者与健康人的血磷值各不相同,如果用离均差平方和(SS)描述其围绕总均数的变异情况,则总变异有以下两个
(1)组内变异,即由于随机误差的原因使得各组内部的血磷值各不相等;
(2)组间变异,即由于克山病的影响使得患者与健康人组的血磷值均数大小不等。
而且:SS总=SS组间+SS组内 v总=v组间+v组内
如果用均方(即自由度v去除离均差平方和的商)代替离均差平方和以消除各组样本数不同的影响,则方差分析就是用组内均方去除组间均方的商(即F值)与1相比较,若F值接近1,则说明各组均数间的差异没有统计学意义,若F值远大于1,则说明各组均数间的差异有统计学意义。实际应用中检验假设成立条件下F值大于特定值的概率可通过查阅F界值表(方差分析用)获得。
3. 方差分析的应用条件
应用方差分析对资料进行统计推断之前应注意其使用条件,包括:
(1)可比性,若资料中各组均数本身不具可比性则不适用方差分析。
(2)正态性,即偏态分布资料不适用方差分析。对偏态分布的资料应考虑用对数变换、平方根变换、倒数变换、平方根反正弦变换等变量变换方法变为正态或接近正态后再进行方差分析。
(3)方差齐性,即若组间方差不齐则不适用方差分析。多个方差的齐性检验可用Bartlett法,它用卡方值作为检验统计量,结果判断需查阅卡方界值表。
二、方差分析的主要内容
根据资料设计类型的不同,有以下两种方差分析的方法:
1. 对成组设计的多个样本均数比较,应采用完全随机设计的方差分析,即单因素方差分析。
2. 对随机区组设计的多个样本均数比较,应采用配伍组设计的方差分析,即两因素方差分析。
两类方差分析的基本步骤相同,只是变异的分解方式不同,对成组设计的资料,总变异分解为组内变异和组间变异(随机误差),即:SS总=SS组间+SS组内,而对配伍组设计的资料,总变异除了分解为处理组变异和随机误差外还包括配伍组变异,即:SS总=SS处理+SS配伍+SS误差。整个方差分析的基本步骤
(1) 建立检验假设;
H0:多个样本总体均数相等。
H1:多个样本总体均数不相等或不全等。
检验水准为0.05。
(2) 计算检验统计量F值;
(3) 确定P值并作出推断结果。
三、多个样本均数的两两比较
经过方差分析若拒绝了检验假设,只能说明多个样本总体均数不相等或不全相等。若要得到各组均数间更详细的信息,应在方差分析的基础上进行多个样本均数的两两比较。
1. 多个样本均数间两两比较
多个样本均数间两两比较常用q检验的方法,即 Newman-kueuls法,其基本步骤为:建立检验假设样本均数排序计算q值查q界值表判断结果。
2. 多个实验组与一个对照组均数间两两比较
多个实验组与一个对照组均数间两两比较,若目的是减小第II类错误,最好选用最小显著差法(LSD法);若目的是减小第I类错误,最好选用新复极差法,前者查t界值表,后者查q’界值表。
回归分析的步骤
1.根据预测目标,确定自变量和因变量
明确预测的具体目标,也就确定了因变量。如预测具体目标是下一年度的销售量,那么销售量Y就是因变量。通过市场调查和查阅资料,寻找与预测目标的相关影响因素,即自变量,并从中选出主要的影响因素。
2.建立回归预测模型
依据自变量和因变量的历史统计资料进行计算,在此基础上建立回归分析方程,即回归分析预测模型。
3.进行相关分析
回归分析是对具有因果关系的影响因素(自变量)和预测对象(因变量)所进行的数理统计分析处理。只有当变量与因变量确实存在某种关系时,建立的回归方程才有意义。因此,作为自变量的因素与作为因变量的预测对象是否有关,相关程度如何,以及判断这种相关程度的把握性多大,就成为进行回归分析必须要解决的问题。进行相关分析,一般要求出相关关系,以相关系数的大小来判断自变量和因变量的相关的程度。
4.检验回归预测模型,计算预测误差
回归预测模型是否可用于实际预测,取决于对回归预测模型的检验和对预测误差的计算。回归方程只有通过各种检验,且预测误差较小,才能将回归方程作为预测模型进行预测。
5.计算并确定预测值
利用回归预测模型计算预测值,并对预测值进行综合分析,确定最后的预测值。
试验设计的重要作用
试验设计在工业生产和工程设计中能发挥重要的作用,主要有:
1.提高产量;
2.减少质量的波动,提高产品质量水准;
3.大大缩短新产品试验周期;
4.降低成本;
5.试验设计延长产品寿命。
在工农业生产和科学研究中,经常需要做试验,以求达到预期的目的。例如在工农业生产中希望通过试验达到高质、优产、低消耗,特别是新产品试验,未知的东西很多,要通过试验来摸索工艺条件或配方。如何做试验,其中大有学问。试验设计得好,会事半功倍,反之会事倍功半,甚至劳而无功。
如果要最有效地进行科学试验,必须用科学方法来设计。所谓试验的统计设计,就是设计试验的过程,使得收集的数据适合于用统计方法分析,得出有效的和客观的结论。如果想从数据作出有意义的结论,用统计方法作试验设计是必要的。当问题涉及到受试验误差影响的数据时,只有统计方法才是客观的分析方法。这样一来,任一试验问题就存在两个方面:试验的设计和数据的统计分析。这两个课题是紧密相连的,因为分析方法直接依赖于所用的设计。
编辑推荐
2013年注册质量工程师(初级)模拟自测题:《综合知识》汇总
2013年注册质量工程师(初级)模拟自测题:《理论与实务》二
欢迎光临该注册质量工程师频道:http://www.reader8.net/exam/zlgc/
更多精彩内容敬请关注读书人网:http://www.reader8.net/