9299.net
大学生考试网 让学习变简单
当前位置:首页 >> 理学 >>

第五章 方差分析_图文

第五章  方差分析_图文

SAS软件与统计应用教程

STAT

第五章 方 差 分 析
? ? ? ?

5.1 方差分析中的有关概念
5.2 单因素方差分析

5.3 双因素方差分析
5.4 均值估计与多重比较

SAS软件与统计应用教程

STAT

?

5.1

方差分析中的有关概念

?

5.1.1 单因素方差分析问题与模型

?
?

5.1.2 双因素方差分析问题与模型
5.1.3 方差分析中的基本假定

方差分析的基本思想

SAS软件与统计应用教程

STAT

在现实的生产和经营管理中,经常要 分析各种因素对研究对象某些特征值 的影响.
方差分析(analysis of variance)就是采用数理统计方法对 数据进行分析,以鉴别各种因素对研究对象的某些特征 值影响大小的一种有效方法. 研究对象的特征值, 即所考察的试验(其涵义包括调查, 收集等)结果(如产品质量、数量、销量、成本等)称为 试验指标,简称指标,常用x表示. 在试验中对所关心的“指标”有影响的、要加以考察而 改变状态的原因称为因素,用A,B,C等大写英文字母表 示.

SAS软件与统计应用教程

STAT

5.1.1 单因素方差分析问题与模型
1. 数学模型
进行单因素方差分析时,需要得到如图5-1所示的数 A因素(i) 据结构。 观测值
(j) 1 2 …

A1 x11 x12
… x1n

A2 x21 x22
… x 2 n2

… … … … …

Am xm1 xm2
… x mn

ni

1

m

设xij表示第i个总体的第j个观测值( i = 1,2,…,m, j = 1,2,…,ni),希望由此对不同水平下总体的均值 进行比较。

SAS软件与统计应用教程

STAT

对此,观察到的xij常用以下的模型表示: xij = ?i + ?ij ,1≤j≤ni,1≤i≤m 其中?i表示第i个总体的均值,?ij为随机误差,在方差分 析中为了得到有效的检验法还常假定?ij满足: ● ?ij为相互独立的; ● ?ij都服从正态分布,且?ij的均值都为0,方差都相 同。

SAS软件与统计应用教程

STAT

2. 方差分析的过程
为了方便起见,可将?i记为: ?i = ? + ?i 其中
??

为因素A的第i个水平的附加效应,这样比较不同水平下均值

? ? 称为总均值,?i = ?i – ?,i = 1,2,…,m称 m
1
i i ?1

m

是否相同。问题的检验假设: H0:?1 = ?2 = … = ?m,H1:?1,?2,…,?m不全相等; 就可以表示为: H0:?1 = ?2 = … = ?m= 0,H1:?1,?2,…,?m不全为零。

SAS软件与统计应用教程

STAT

在H0成立下检验用统计量:
F?
m ni

SSM A ( m ? 1) SSE ( n ? m)
2

~ F ( m ? 1, n ? m)
m ni

其中

、 SSE ? ?? ( xij ? xi ) 2 称为组间、组 SSM A ? ?? ( xi ? x )
i ?1 j ?1
ni

内(变差)平方和;这里 xi.
x ?

?? x n
i ?1 j ?1

1

m

ij

? x 称为组内平均; n 称为总平均,n = n1 + n2 + … + nm;另外
?
ij i j ?1

1

i ?1 ni

j ?1

SST ? ?? ( xij ? x )
i ?1 j ?1

m

ni

2

称为全部(变差)平方和;可以证明 SST = SSMA + SSE。

SAS软件与统计应用教程

STAT

当原假设成立时,各总体均值相等,各样本均值间的 差异应该较小,模型平方和也应较小,F统计量取很大 值应该是稀有的情形。 所以对给定显著性水平α?(0, 1),若p = P{F ? F0} < α, 则拒绝原假设H0(F0为F统计量的观测值),可以认为 所考虑的因素对响应变量有显著影响;否则不能拒绝H0, 认为所考虑的因素对响应变量无显著影响。

SAS软件与统计应用教程

STAT

3. 方差分析表
通常将上述计算结果表示为表5-1所示的方差分析表。
表5-1 单因素方差分析表

来源Source 组间 组内 全部(C-tatol)

自由度DF m–1 n–m n–1

平方和Sun of Square SSMA SSE SSA+SSE

平均平方和 Mean Square SSMA/(m – 1) SSE/(n – m)

F统计量 F value MSA/MSE

p值Pr > F p

其中,MSA = SSMA/(m – 1),MSE = SSE/(n – m)。利用 方差分析表中的信息,就可以对因素各水平间的差异是 否显著做出判断。

例2.1.1 某公司为了研究三种内容的广告宣传对某

种无季节性的大型机械销售量的影响进行了调查统计.经广告广泛宣 传后,按寄回的广告上的订购数计算,一年四个季度的销售量(单位: 台)为: 广告类型 A1
A2

第一季度 163
184

第二季度 176
198

第三季度 170
179

第四季度 185
190

A3

206

191

218

224

A1是强调运输方便性的广告,A2是强调节省燃料的经济性的广告, A3是强调噪音低的优良性的广告.试判断:新闻广告的类型对该种机 械的销售量是否有显著影响?若影响显著,哪一种广告内容为好?

返回

分析结果如下:

P { F ( 2 ,9 ) ? 10 . 93013 } ? 0 . 003907

?? 0 . 05

所以拒绝H0,即认为广告内容不同对销售量的影响是显著

返回

例2. 设有三台机器,用来生产规格相同的铝合金薄板. 取样,测量 薄板的厚度精确至千分之一厘米. 得结果如表所示. 问不同机器对 生产的铝合金板的厚度有无影响, 请看分别用菜单系统和程序进 行讨论.程序名data lb给出了单因素方差分析的典型解法,进行了方 差分析同时又在各水平组间进行了均值的比较,作了直方图,菜单 系统和程序中均有选项”Dunnett”进行某一水平和其余水平的均 值差异比较和检验,选项”snk”则进行所有水平间均值差异的比较 和检验.

返回

? 例. 设有三台机器,用来生产规格相同的铝合金 薄板. 取样,测量薄板的厚度精确至千分之一厘 米. 得结果如表所示. 问不同机器对生产的铝合金板的厚度有无影响?

返回

1.编程输入数据: Data E411; input c $ y @@; cards; 1 0.236 2 0.257 3 1 0.238 2 0.253 3 1 0.248 2 0.255 3 1 0.245 2 0.254 3 1 0.243 2 0.261 3 ; proc print; RUN;

0.258 0.264 0.259 0.267 0.262

返回

? Solution→Analysis→Analyst(分析员系统) (出现 空白数据表)→ File→Open By Sas Name… (在 Make one selection窗口中)work 选中数据名 E411→ (OK) →Statistics→ANOVA → One-Way ANOVA… ? Independent填分类变量c→ Dependent因变量y ? Plots—可选择分水平的盒形图(Box-&-Whisker Plot) ,条形图(Bar Chart)及均值、标准差图 ? Means—Comparisons Methods给出了10种多重比 较的方法 ? α为选择的显著性水平, Breakdown可按水平 分组出描述性统计量 ? → OK (点击运行后的结果树标签则会打开相应 返回 图.

Sum of > F 0.0022

Source Model

DF 2

Squares

Mean Square

F Value

Pr 19.95

0.00058067

0.00029033

Error
Corrected Total 8

6

0.00008733

0.00001456

0.00066800

因 F0 .05 ( 2 ,12 ) ? 3 . 89 ? 19 . 95 ,故在水平0. 05下拒绝H0,认为各台机 器生产的薄板厚度有显著的差异.

返回

SAS软件与统计应用教程

STAT

5.1.2 双因素方差分析问题与模型
1. 无交互作用的双因素方差分析
对于多因素问题,通常考虑有重复观测的情形,其数据结 构如图5-2所示。 图5-2 双因素方差分析中数据结构
观测值 A1 B1 B 因 素 (j) B2 … x111…x11n x121…x12n … A2 x211…x21n x221…x22n … A因素(i) … … … … Al xl11…xl1n xl21…xl1n … 平均值

x1.

x 2.

Bm
平均值

x1m1…x1mn

x2m1…x2mn



xlm1…xlmn

xm .

x .1

x .2

x. l

x

SAS软件与统计应用教程

STAT

若第一个因素A有l个水平,第二个因素B有m个水平。 在因素A的第i个水平和因素B的第j个水平下进行了多次 观测,记为{xijk,1≤k≤n}。 对xijk考虑以下模型: xijk= ? + ?i + ?j + ?ijk, 1≤i≤l,1≤j≤m,1≤k≤n 其中?表示平均的效应,?i和?j分别表示因素A的第i个 水平和因素B的第j个水平的附加效应,?ijk为随机误差, 同样这里的随机误差也假定它是独立的并且服从等方差 的正态分布。

SAS软件与统计应用教程

STAT

要说明因素A有无显著影响,就是要检验如下假设: H0A:?1 = ?2 = … = ?l, H1A:?1,?2,…,?l不全相等; 要说明因素B有无显著影响,就是要检验如下假设: H0B:?1 = ?2 = … = ?m, H1B:?1,?2,…,?m不全相等; 而模型无显著效果是指以上两个假设的原假设同时成立。

SAS软件与统计应用教程

STAT

在H0A、H0B成立时,检验用统计量:
FA ? FB ? SSM A (l ? 1) SSE (lmn ? l ? m ? 1) SSM B (m ? 1) SSE (lmn ? l ? m ? 1)
H 0 A真

~ F (l ? 1, (lmn ? l ? m ? 1))

H 0 B真

~ F ( m ? 1, (lmn ? l ? m ? 1))

对于给定的显著性水平α 当值p = P{FA > FA0} < α时拒绝H0A; 当值p = P{FB > FB0} < α时拒绝H0B。 其中,FA0为FA统计量的观测值,FB0为FB统计量的观 测值。

SAS软件与统计应用教程

STAT

2. 有交互作用的多因素方差分析
对于有交互作用的观测{xijk},采用以下的模型: xijk= ? + ?i + ?j + ?ij + ?ijk, 1≤i≤l,1≤j≤m,1≤k≤n 其中?表示平均的效应,?i和?j分别表示因素A的第i个 水平和因素B的第j个水平的附加效应,? ij 表示因素A的 第i个水平和因素B的第j个水平交互作用的附加效应。 ?ijk为随机误差,这里也假定它是独立的并且服从等方差 的正态分布。 注意,其中n必须大于1,即为了检验交互作用,必须 有重复观测。

SAS软件与统计应用教程

STAT

要说明交互作用有无显著影响,就是要检验如下假设: H0(A*B):?ij = 0(1≤i≤l,1≤j≤m), Hl(A*B):?ij不全为零(1≤i≤l,1≤j≤m) 所以在多因素方差分析中,须在无交互作用所作检验 的基础上,加上交互作用的检验。

SAS软件与统计应用教程

STAT

构造H0A,H0B,H0(A*B)的检验统计量分别为
SSE lm( n ? 1) SSM B (m ? 1) H 0 B真 FB ? ~ F ( m ? 1, lm( n ? 1)) SSE lm(n ? 1) SSM ( A*B ) (l ? 1)( m ? 1) H 0 A*B真 ? ~ F (( l ? 1)( m ? 1), lm ( n ? 1)) SSE lm ( n ? 1) FA ? SSM A (l ? 1)
H 0 A真

~ F (l ? 1, lm(n ? 1))

F( A*B )

对于给定的显著性水平α 当值p = P{FA≥FA0}<α时拒绝H0A,否则不能拒绝H0A; 当值p = P{FB≥FB0}<α时拒绝H0B,否则不能拒绝H0B; 当值p = P{F(A*B)≥F(A*B)0}<α时拒绝H0(A*B),否则不能拒绝 H0(A*B)。

SAS软件与统计应用教程

STAT

3. 方差分析表
无交互作用的双因素方差分析表见表5-2。
表5-2 无交互作用的双因素方差分析表
来源 Source 因素A 因素B 随机误差 全部 自由度DF l–1 m–1 lmn – l – m + l lmn – 1 平方和 Sun of Square SSMA SSMB SSE SSA+SSB+SSE 平均平方和 Mean Square SSMA/(l – 1) SSMB/(m – 1) SSE/(lmn – l – m + l) F统计量 F value MSA/MSE MSB/MSE p值Pr > F p(A) p(B)

其中MSA = SSMA/(l – 1),MSB = SSMB/(m – 1),MSE = SSE/(lmn – l – m + l)。利用方差分析表中的信息,就可 以对每个因素各水平间的差异是否显著做出判断。

SAS软件与统计应用教程

STAT

有交互作用的双因素方差分析表见表5-3。
表5-3 有交互作用的双因素方差分析表
来源Source 因素A 因素B A*B 随机误差 全部 自由度DF l–1 m–1 (l – 1) (m – 1) lm(n – 1) lmn – 1 平方和Sun of Square SSMA SSMB SSM(A*B) SSE SSMA+SSMB+ SSM(A*B)+SSE 平均平方和Mean Square SSMA/(l – 1) SSMB/(m – 1) F统计量 F value MSA/MSE MSB/MSE p值Pr > F pA pB p(A*B)

SSM(A*B)/ (l –1)(m–1) MS(A*B)/MS E SSE/lm(n – l)

其中MSA = SSMA/(l – 1),MSB = SSMB/(m – 1), MS(A*B) = SSM(A*B)/ (l – 1) (m – 1),MSE = SSE/lm(n – l)。 利用表中的信息,就可以对各个因素间交互作用是否显 著和每个因素各水平间的差异是否显著做出判断。

SAS软件与统计应用教程

STAT

5.1.3 方差分析中的基本假定
方差分析中常用的基本假定是: ● 正态性:每个总体均服从正态分布,也就是说,对于 每一个水平,其观测值是来自正态分布的简单随机样本。 ● 方差齐性:各总体的方差相同。 ● 独立性:从每一总体中抽取的样本是相互独立的。 在SAS中,正态性可用第3章介绍的方法来验证,也可通 过本章介绍的“残差的正态性检验”来验证,方差齐性可以 在方差分析的过程进行验证,而独立性可由试验的随机化确 定。

SAS软件与统计应用教程

STAT

?

5.2

单因素方差分析

?

5.2.1 用INSIGHT作单因素方差分析

?
?

5.2.2 用“分析家”作单因素方差分析
5.2.3 用过程进行单因素方差分析

SAS软件与统计应用教程

STAT

5.2.1 用INSIGHT作单因素方差分析
1. 实例
【例5-1】消费者与产品生产者、销售者或服务的提供 者之间经常发生纠纷。当发生纠纷后,消费者常常会向 消费者协会投诉。为了对几个行业的服务质量进行评价, 消费者协会在零售业、旅游业、航空公司、家电制造业 分别抽取了不同的企业作为样本。每个行业各抽取5家 企业,所抽取的这些企业在服务对象、服务内容、企业 规模等方面基本上是相同的。然后统计出最近一年中消 费者对总共20家企业投诉的次数,结果如表5-4。

SAS软件与统计应用教程
表5-4 消费者对四个行业的投诉次数
零售业
57 66 49

STAT

旅游业
68 39 29

航空公司
31 49 21

家电制造业
44 51 65

40
44

45
56

34
40

77
58

通常,受到投诉的次数越多,说明服务的质量越差。 消费者协会想知道这几个行业之间的服务质量是否有显 著差异,即在方差分析中检验原假设:四个行业被投诉 次数的均值相等。

2. 分析步骤

SAS软件与统计应用教程

STAT

1) 将表5-4中数据整理成如图左所示结构的数据集, 存放在Mylib.xfzts中; 2) 在INSIGHT模块中打开数据集Mylib.xfzts; 3) 选择菜单“Analyze(分析)”→“Fit(拟合)”, 在打开的“Fit(X Y)”对话框中按图(右)选择分析变量; 4) 单击“OK”按钮,得到分析结果。

SAS软件与统计应用教程

STAT

3. 结果分析

SAS软件与统计应用教程

STAT

第一张表提供拟合模型的一般信息:

第二张表为列名型变量信息,即HANGYE为列名型 的,有4个水平; 第三张表提供参数信息,并且约定,P_2、P_3、P_4、 P_5分别为航空、家电、零售和旅游4个行业的标识变量 (也称哑变量)。如下图所示。

STAT 第四张表给出响应变量均值关于自变量不同水平的模 型方程,如图5-6所示。
SAS软件与统计应用教程

其中,标识变量取值:

, ?1 HANGYE ? 航空 P_2 ? ? , 其他 ?0, , ?1 HANGYE ? 家电 P_3 ? ? , 其他 ?0, , ?1 HANGYE ? 零售 P_4 ? ? , 其他 ?0,

SAS软件与统计应用教程

STAT

第五张表(图5-7)给出模型拟合的汇总信息,其中: R-Square ( R2 ) 是 判 定 系 数 ( coefficient of determination),阐明了自变量所能描述的变化(模型 平方和)在全部变差平方和中的比例,它的值总在0和1 之间,其值越大,说明自变量的信息对说明因变量信息 的贡献越大,即分类变量取不同的值对因变量的影响越 显著。Aaj R-Sq(校正R2)是类似于R2的,但它随模型 中的参数的个数而修正。

STAT 第六张为方差分析表,如图5-8所示,其中各项含义可参见 表5-1的说明。
SAS软件与统计应用教程

从方差分析表可以看出,p值小于0.05(显著水平),所 以拒绝原假设,即不同行业的消费者投诉次数有显著差异。 第七张表提供III型检验,它是方差分析表的细化,给出 了各因素的平方和及F统计量,因为本例是单因素的,所以 这一行与图5-8的“Model”一行相同。如图5-9所示。

SAS软件与统计应用教程 STAT 第八张为参数估计表,其中有关于不同行业下投诉次数差异的估计和 检验:

1) 根据标识变量的定义,Intercept后的估计47.4是对应于旅游业 投诉次数的均值,其后的t检验是检验这一均值是否为0。 这里p值<0.0001<0.05=α,故显著非0。 2) 航空后的估计-12.4是航空业与旅游业投诉次数均值之差的估计 值,其后的t检验也是检验这两个投诉次数均值之差是否为0。 由于p值的绝对值为0.1313 > 0.05,所以航空业与旅游业的被投诉 次数没有显著差异的。其它分析类似。

SAS软件与统计应用教程

STAT

4. 检验模型假定
为了验证残差为正态分布的假定,回到数据窗口。可以看 到R_TOUSU(残差)和P_TOUSU(预测值)已加到数据 集之中,下面用Distribufion(Y)来验证残差的正态性。 1) 选择菜单“Analyze”→“Distribution(Y)”; 2) 在打开的“Distribution(Y)”对话框中选定分析变量: R_TOUSU;单击“OK”按钮;

SAS软件与统计应用教程

STAT

3) 选择菜单“Curves”→“Test for Distribution”;在 打开的“Test for Distribution”对话框中直接单击“OK” 按钮。 在检验结果的“Test for Distribution”表中看到,p值 大于0.05,不能拒绝原假设,表明可以认为残差是正态 分布的(图5-12)。

SAS软件与统计应用教程

STAT

5.2.2 用“分析家”作单因素方差分析
1. 分析步骤
1) 在“分析家”中,打开数据集Mylib.xfzts; 2) 选择菜单“Statistics(统计)”→“ANOVA(方 差 分 析 ) ” → “ One-Way ANOVA ( 单 因 素 方 差 分 析)”,打开“One-Way ANOVA”对话框;

SAS软件与统计应用教程

STAT

3) 选中分类变量HANGYE,单击“Independent”按钮, 将其移到“Independent(自变量)”框中;选中数值变量 TOUSU,单击按钮“Dependent”,将其移到“Dependent (因变量)”框中,如图5-13所示;

STAT 4) 为 了 检 验 方 差 分 析 中 关 于 方 差 齐 性 的 假 定 , 单 击 “Tests”按钮,打开“One-Way ANOVA:Tests”对话框, 选中“Tests for equal variance”栏下的“levene's test”复选 框(常用),如图左,单击“OK”按钮返回;
SAS软件与统计应用教程

SAS软件与统计应用教程

STAT

5) 单击“Plots”按钮,打开“One-Way ANOVA:Plots” 对话框,可以选择图形类型,如选中“Types of plots” 栏下的“Box-&-whisker plot”复选框,如图右,单击 “OK”按钮返回;再次单击“OK”按钮。

SAS软件与统计应用教程

STAT

2. 结果分析
在显示的结果中,提供了自变量的各个水平和单因素方差 分析表。 结果分为五个部分,第一部分(下图左)是因素水平的 信息,可以看到只有一个因素HANGYE,它的4个水平分别 是航空、家电、零售、旅游,共有20个观测。

SAS软件与统计应用教程

STAT

第二部分就是经典的方差分析表。由于这里p值小于0.05 (显著水平),所以模型是显著的,即因素对指标有显著影 响。 第三部分是一些与模型有关的简单统计量,第一个是复相 关系数平方R2,代表总变差中能被模型解释的比例,第二个 是指标的变异系数,第三个是根均方误差,第四个是均值。 第四部分是方差分析表的细化,给出了各因素的平方和及 F统计量,因为是单因素所以这一行与上面的“Model(模 型)”一行相同。

SAS软件与统计应用教程

STAT

第五部分是对方差齐性的假定检验的结果,如图5-16 所示。结果表明使用Levene's检验法的p值为0.6357,所 以不同水平下观测结果的方差无显著差异。

STAT 在分析家窗口的项目管理器中双击“Boxplot of TOUSY by HANGYE”选项,得到响应变量关于自变量各水平的盒 形图如图5-17所示。
SAS软件与统计应用教程

图中从左到右依次为航空、家电、零售、旅游等水平的盒 形图,可以从中对不同水平下均值的差异以及方差的差异有 一个直观的了解。

SAS软件与统计应用教程

STAT

5.2.3 用过程进行单因素方差分析
1. ANOVA过程和GLM过程的简介
(1) ANOVA过程 ANOVA过程的一般格式包含许多选项,其中最为常 用的为如下格式:
PROC ANOVA DATA = <数据集>; CLASS <自变量列表>; MODEL <因变量名> = <自变量表达式>[/<选项列表>]; MEANS <自变量表达式>[/<选项>]; RUN;

SAS软件与统计应用教程

STAT

其 中 CLASS 语 句 用 来 指 定 样 本 分 组 的 分 类 变 量 , CLASS语句是必需的,而且必需位于MODEL语句之前; MODEL语句给出模型表达式,可以用来表示三种不 同的效应模型: 1) 主效应模型:y = a b c 2) 交互效应模型:y = a b c a*b a*c b*c a*b*c 3) 嵌套效应模型:y = a b c(a b) 同一MODEL语句中三种效应可以混合使用。 MEANS语句指定ANOVA过程计算自变量各水平下 因变量的均值、标准差,并进行组间的多重比较。

SAS软件与统计应用教程

STAT

(2) GLM过程
PROC GLM DATA=<数据集> [ALPHA = <p>]; CLASS <自变量列表>;

MODEL <因变量名> = <自变量表达式>[/<选项列表>];
MEANS <自变量表达式>[/<选项>]; RUN;

一般地,ANOVA过程中涉及的所有语句都包含在 GLM过程所涉及的语句中,其用法和功能也都是基本 相同的。

SAS软件与统计应用教程

STAT

2. 使用ANOVA过程作单因素方差分析
使用ANOVA过程对例5-1作方差分析的方法:
proc anova data = Mylib.xfzts; class hangye; model tousu = hangye; run;

分析结果与“分析家”相同。

SAS软件与统计应用教程

STAT

3. 使用GLM过程作单因素方差分析
使用GLM过程对例5-1作方差分析的方法:
proc GLM data = Mylib.xfzts; class hangye; model tousu = hangye; run;

分析结果与“分析家”相同。

编程进行单因素方差分析 (注意Roman 字型) Data E411; input c y @@; cards; 1 0.236 2 0.257 3 0.258 1 0.238 2 0.253 3 0.264 1 0.248 2 0.255 3 0.259 1 0.245 2 0.254 3 0.267 1 0.243 2 0.261 3 0.262 ; proc glm data=E411; /*glm为方差分析*/ class c ; /*分类变量c*/ model y=c; /*模型 因变量=自变量*/ lsmeans c; /*最小误差法*/ means c; /*求c的均值*/ RUN;

SAS软件与统计应用教程

STAT

SAS软件与统计应用教程

STAT

?

5.3

双因素方差分析

?

5.3.1 用INSIGHT作双因素方差分析

?
?

5.3.2 用“分析家”作双因素方差分析
5.3.3 用GLM过程进行双因素方差分析

SAS软件与统计应用教程

STAT

5.3.1 用INSIGHT作双因素方差分析
1. 不存在交互作用的双因素方差分析
【例5-2】为了提高一种橡胶的定强,考虑三种不同的 促进剂(因素A)、四种不同分量的氧化锌(因素B)对定强 的影响,对配方的每种组合重复试验两次,总共试验了 24次,得到表5-5的结果。
表5-5 橡胶配方试验数据
A:促进剂 1 2 3 B:氧化锌 1 31,33 33,34 35,37 2 34,36 36,37 37,38 3 35,36 37,39 39,40 4 39,38 38,41 42,44

SAS软件与统计应用教程

STAT

要用方差分析将不同促进剂和不同份量氧化锌的影响区 分开来。即检验: H0A:不同促进剂对定强无影响,H1A:不同促进剂对 定强有显著影响 H0B:氧化锌的不同分量对定强无影响,H1B:氧化剂 的不同分量对定强有显著影响

(1) 分析设置 SAS软件与统计应用教程 STAT 1) 将表5-5中数据整理成如图5-18左所示结构的数据 集,存放在Mylib.xjpf中;

SAS软件与统计应用教程

STAT

2) 在INSIGHT模块中打 开数据集Mylib.xjpf。由于 在 Insight 中 , 要 求 方 差 分 析中的自变量必须是列名 型的,故先把变量a和b的 测量水平由区间型改为列 名型;
3) 选择菜单“Analyze(分析)”→“Fit(拟合)”,在 打开的“Fit(X Y)”对话框中选择数值型变量作因变量,分类 型变量作自变量:选择变量stren,单击“Y”按钮,选择变 量a和b,单击“X”按钮,分别将变量移到列表框中,如图518右所示;单击“OK”,得到分析结果。

SAS软件与统计应用教程 STAT (2) 分析结果 1) 第一张表提供了模型的一般信息;第二张表列举了 作为分类变量的a和b的水平的信息;第三张参数信息表 给出了标识变量P_i的定义;

其中,标识变量取值:
, a ?1 ?1 P_2 ? ? , ,其他类似; ? ?0, 其他 , b ?1 ?1 P_5 ? ? , ,其他类似。 ? ?0, 其他

SAS软件与统计应用教程

STAT

2) 第四张表给出了方差分析模型,利用参数信息表中 标识变量的定义可以推算出在各个因素不同水平下变量 stren均值的信息;第五张拟合汇总表中给出变量stren 的均值为37.0417,判定系数R2为0.8945等,如图5-20;

图5-20 多因素方差分析第4、5张表

SAS软件与统计应用教程

STAT

3) 在第六张方差分析表中,检验模型显著性的F统计量为 30.53,相应的p值小于0.05 = ?,所以拒绝a和b对分析变量 stren无显著影响的假设,即模型是显著的; 在模型显著的情况下常需要进一步分析两个因素是否都有 显著影响或者只有一个因素是显著的,这时就需要用到第七 张表提供的信息。在III型检验表中,进一步将模型平方和 分解为属于a和b的平方和。在这里两个因素的p值都小于 0.05,再一次说明了这两个因素对分析变量stren都有显著影 响,如图5-21。

SAS软件与统计应用教程

STAT

SAS软件与统计应用教程

STAT

4) 第八张是模型的参数估计表(图5-22),参数估计 表也是根据标识变量的定义,对参数或对各因素不同水 平下的参数之差进行估计和检验。可以根据t统计量的p 值来检验不同水平下均值是否有显著差异。
图5-22 多因素方差分析第8张表

SAS软件与统计应用教程

STAT

模型方程提供了各个因素不同水平下变量stren均值的信 息,利用参数信息表中标识变量P_j的定义可以推算出:
a ? 1, b ? 1 ?42.2917 ? 3.75 ? 6.5 ? 42.2917 ? 2.125 ? 6.5 a ? 2, b ? 1 ? ? stren 的均值 ? ?42.2917 ? 6.5 a ? 3, b ? 1 ?? ? ? ?42.2917 a ? 3, b ? 4 ?

参数估计表根据标识变量的定义,对参数或不同水平下 参数之差进行估计和检验。如第一行是对a = 3,b = 4水平 下均值的估计和检验,第二行是a = 1,b = 4水平下的均值 与a = 3,b = 4水平下均值之差的估计与检验。 结果表明两个因素的各水平下的均值都有显著差异。

SAS软件与统计应用教程

STAT

5) 考察模型假定:在显示窗的底部有一个残差和预测值的 散点图(如图5-23所示),可以像单因素分析一样考察残差 分布的正态性假定。

SAS软件与统计应用教程

STAT

2. 存在交互作用的双因素方差分析
【例5-3】考虑合成纤维收缩率(因素A)和总拉伸倍数(因 素B)对纤维弹性y的影响。收缩率取4个水平:A1 = 0, A2 = 4,A3 = 8,A4 = 12;因素B也取4个水平:B1 = 460, B2 = 520,B3 = 580,B4 = 640。在每个组合AiBj下重复 做二次试验,弹性数据如表5-6所示。
表5-6 合成纤维收缩率和总拉伸倍数对纤维弹性的影响
A:收缩率 0 4 8 B:拉伸倍数

460
71,73 73,75 76,73

520
72,73 76,74 79,77

580
75,73 78,77 74,75

640
77,75 74,74 74,73

12

75,73

73,72

70,71

69,69

考虑如下问题: 1) 收缩率(因素A)、拉伸倍数(因素B)对弹性y有无显 著性 影响? 2) 因素A和因素B是否有交互作用? 3) 使纤维弹性达到最大的生产条件是什么? 要用方差分析将不同收缩率和不同拉伸倍数的影响区分开来。 即检验: H0A:不同收缩率对弹性无影响,H1A:不同收缩率对弹性有 显著影响 H0B:不同拉伸倍数对弹性无影响,H1B:不同拉伸倍数对弹 性有显著影响

SAS软件与统计应用教程

STAT

SAS软件与统计应用教程

STAT

(1) 分析设置 1) 将表5-6中数据整理成 如图所示结构的数据集,存 放在Mylib.xwtx中; 2) 在 INSIGHT 模 块 中 打 开数据集Mylib.xwtx。由于 在Insight中,要求方差分析 中的自变量必须是列名型的, 故先把变量a和b的测量水平 由区间型改为列名型;

SAS软件与统计应用教程

STAT

3) 选择菜单“Analyze(分析)”→“Fit(拟合)”, 在打开的“Fit(X Y)”对话框中选择数值型变量作因变量, 分类型变量作自变量,如图所示。

图5-24 数据集xwtx与分析变量的选择

为了考虑变量a和b的交互作用,同时选上a、b,然后 单击“Cross”按钮,注意到在右框中多了a*b一行,如 图5-24右所示。 4) 单击“OK”按钮,得到分析结果。

SAS软件与统计应用教程

STAT

(2) 分析结果 1) 在参数信息表中较无交互作用的情形多了表示两个 因素各个水平组合下的标识变量,而在模型方程表中也 就多了许多的参数,如图5-25所示;
图5-25 多因素方差分析的前5张表

SAS软件与统计应用教程

STAT

2) 在方差分析表中,检验模型显著性的F统计量为 7.87,相应的p值为0.0001<0.05,所以模型的效应是显 著的;
3) 在Ⅲ型检验表中,将模型平方和分解为两个因素和 它们的交互作用,表中看出,检验b变量效应的p值为 0.1363 > 0.05,所以从总体上看b变量的效应不显著;检 验a变量效应的p值为<0.0001<0.05,所以变量a的效应是 显著的;检验两者交互作用的p值为0.0006<0.05,所以 交互作用的影响也是显著的,如图5-27。

SAS软件与统计应用教程

STAT

4) 在模型方程(图5-25中)和参数估计表(图5-28) 中也提供了双因素不同水平组合下因变量y均值的估计 和比较的信息。因为这里是考虑存在交互作用的情形, 所以较为复杂一些。

SAS软件与统计应用教程

STAT

5.3.2 用“分析家”作双因素方差分析
1. 不存在交互作用的双因素方差分析
下面介绍在“分析家”中对例5-2作方差分析: 1) 在“分析家”中,打开数据集Mylib.xjpf; 2) 选择菜单“Statistics(统计)”→“ANOVA(方 差分析)”→“Factorial ANOVA(因素方差分析)”, 打开“Factorial ANOVA”对话框(如图5-29);

SAS软件与统计应用教程

STAT

若要得到用图形表示的两个因素不同水平下均值和标 准 差 的 信 息 , 可 以 单 击 “ Plots” 按 钮 , 在 打 开 的 “Factorial ANOVA:Plots”对话框中,选中“Means plots”栏下的“Plots Dependent Means for Main Effects (作主效应响应均值图)”。

SAS软件与统计应用教程

STAT

4) 分析结果如图5-30所示,其中内容前面已讲,这里 不再赘述。
图5-30 无交互作用的多因素方差分析

SAS软件与统计应用教程

STAT

5) 在分析家窗口的项目管理器中依次双击“Means Plots”下的两个选项,得到响应变量关于自变量a、b的 均值图如图5-31所示。

图5-31 响应变量关于自变量a、b的均值图

图中描述了变量a、b不同水平下的均值和标准差的图 形,从中可以对不同水平下均值的差异有一个直观的了 解。

SAS软件与统计应用教程

STAT

2. 存在交互作用的双因素方差分析
下面介绍在“分析家”中对例5-3合成纤维的试验数 据作方差分析。分析步骤如下: 1) 在“分析家”中,打开数据集Mylib.xwtx; 2) 选 择 菜 单 “ Statistics”→“ANOVA”→“Factorial ANOVA”,打开“Factorial ANOVA”对话框,按图选 择参数与图形;

SAS软件与统计应用教程

STAT

输出的方差分析表给出双因素考虑交互作用的方差分 析模型是显著的(F=7.87,p = 0.0001),最下面一张表给 出两个因素和交互作用的检验结果。由最后一列“Pr > F”的三个p值可以看出因素A及因素A与B的交互作用 (A*B)对指标y的影响是高度显著的,而因素B在? = 0.05 的水平上对指标y的影响是不显著(p = 0.1363 > 0.05)。

SAS软件与统计应用教程

STAT

在分析家窗口的项目管理器中依次双击选项“Means Plot of y by a and b”,得到双因素不同水平下因变量均 值差异的连线图如图5-35所示。

直观地可以看出使纤维弹性达最大的最佳生产条件是A3 和B2;其次是A2和B3。

SAS软件与统计应用教程

STAT

5.3.3 用GLM过程进行双因素方差分析
1. 不考虑交互作用
过程GLM也可用于多因素方差分析,其用法与单因 素方差分析是相同的,只需要在class语句和model语句 中分别填入表示因素的多个自变量。以数据集 Mylib.xjpf为例,为了比较变量a和b不同水平下因变量 stren均值的差异,可使用以下程序:
proc glm data = Mylib.xjpf; class a b; model stren=a b; run;

SAS软件与统计应用教程

STAT

提交上述程序后得到与上一节使用“分析家”有相似 的结果,如图5-36所示。

有关的说明请参见上节的解释。

SAS软件与统计应用教程

STAT

2. 考虑交互作用
使用过程GLM于多因素方差分析时,若要考虑交互 作用只需要在model语句中增加相应的交互作用项即可。 以数据集Mylib.xjpf为例,为了比较变量a和b不同水平 组合下变量stren均值的差异,可使用以下的程序:
proc glm data = Mylib.xjpf; class a b; model stren=a b a*b; run;

这里model语句中a*b就是指明要考虑交互作用。

SAS软件与统计应用教程

STAT

提交这一程序后的输出如图5-37所示。
图5-37 使用GLM过程作有交互作用的多因素方差分析

SAS软件与统计应用教程

STAT

?

5.4

均值估计与多重比较

?

5.4.1 概述

?

5.4.2 用“分析家”进行均值比较

SAS软件与统计应用教程

STAT

5.4.1 概述
在方差分析中,不论是单因素或多因素的实验结果, 都是检验关于参数的一个整体的假设。若原假设被拒绝, 表明某个因素各个水平下的响应有显著差异或因素间存 在交互影响,但并不了解某两个水平下响应是否有差异。 所以在方差分析后,还常需要对各水平下响应变量的均 值进行估计和比较。

SAS软件与统计应用教程

STAT

5.4.2 用“分析家”进行均值比较
1. 对于单因素方差分析的均值比较
下面介绍在“分析家”中对例5-1作均值比较。 (1) 分析设置 1) 在“分析家”中,打开数据集Mylib.xfzts;
2) 选 择 菜 单 “ Statistics”→“ANOVA” →“One-Way ANOVA” , 打开“One-Way ANOVA” 对话框,按图所示设置;

SAS软件与统计应用教程

STAT

3) 单击“Means(均值)”按钮,在打开的“OneWay ANOVA : Means” 对 话框 中 选 中 “ Comparisons (比较)”选项卡。按图设置。

SAS软件与统计应用教程

STAT

(2) 分析结果 1) 使用Tukey's HSD检验法的结果,如图5-39所示。

图5-39 Duncan's Multiple Range检验法

它先提示这一检验法是控制整体的第一类错误的,但 它的第二类错误一般比REGWQ方法要高。

SAS软件与统计应用教程

STAT

然后指出根据所用的方法,两个均值间显著差异最小 值为20.362,即不同水平间均值之差超过20.362,就表 明这两个水平下的均值是有显著差异的。 最后,不同水平下响应变量的均值自大至小排成一列, 无显著效应的水平在左侧用同一字母标出。例如,航空 业与旅游业、零售业无显著差异,与家电制造业有显著 差异,家电制造业与零售业、旅游业无显著差异,等等。

SAS软件与统计应用教程

STAT

2) 使用Dunnett's t-test检验法的结果,如图所示。

图5-40 Dunnett's t-test检验法

用这一方法给出t的临界值为2.34654,两个均值间显 著差异最小值为18.297。以下显示成组比较的结果,凡 是达到0.08显著性水平的则在最右边一栏加标三个星号 ***。可以看出,家电制造业与航空业有显著差异。其 他行业之间均无显著差异。

SAS软件与统计应用教程

STAT

3) 使用Fisher最小显著差异(LSD)检验法的结果,如 图所示。

图5-41 Fisher最小显著差异(LSD)检验法

用这一方法给出t的临界值为1.86928,两个均值间显 著差异最小值为14.576。以下显示成组比较的结果,可 以看出,航空业与旅游业无显著差异,与其他行业均有 显著差异。其他行业之间均无显著差异。

SAS软件与统计应用教程

STAT

2. 对于多因素方差分析的均值比较
下面介绍在“分析家”中对例5-3合成纤维的试验数 据作均值比较。 (1) 分析设置 1) 在“分析家”中,打开数据集Mylib.xwtx; 2) 选择菜单“Statistics(统计)”→“ANOVA(方 差分析)”→“Factorial ANOVA(因素方差分析)”, 打开“Factorial ANOVA”对话框; 3) 选中变量a、b,单击“Independent(自变量)” 按钮,将其移到“Independent”框中;选中变量y,单 击 按 钮 “ Dependent ( 因 变 量 ) ” , 将 其 移 到 “Dependent”框中;

STAT 4) 考虑因素间的交互作用:单击“Model”按钮,打开 “ Factorial ANOVA Model” 对 话 框 。 单 击 “ Standard Models”按钮,在弹出的菜单中选择“Effects up to 2-wav interactions”项,表示交互作用的a*b加入了模型效应栏,单 击“OK”按钮返回;
SAS软件与统计应用教程

图5-42 设置模型和均值参数

SAS软件与统计应用教程

STAT

5) 单击“Means(均值)”按钮,在打开的“One-Way ANOVA:Means”对话框中选中“Comparisons(比较)” 选项卡。 在“Comparison method”下拉列表中选择比较法Fisher's LSD,在“Main effects(主效应)”栏中选择变量a、b,单 击 “ Add” 按 钮 , 加 到 主 效 应 框 中 。 再 在 “ Comparison method” 下 拉 列 表 中 选 择 比 较 法 Tuck's HSD , 在 “ Main effects(主效应)”栏中选择变量a,单击“Add”按钮,加 到主效应框中,如图5-42; 单击“OK”,返回,再单击“OK”得到分析结果。

SAS软件与统计应用教程 STAT (2) 分析结果 在显示方差分析结果的后面,有关于均值比较的三张表, 如图5-43、4-44所示。 用Fisher最小显著差异检验的结果表明(图5-43),收缩 率为4和8之间无显著差异,而另两个收缩率有显著差异。拉 伸倍数520和640之间有显著差异,其余无显著差异。

图5-43 Fisher最小显著差异检验

SAS软件与统计应用教程

STAT

SAS软件与统计应用教程

STAT

用Tucky诚实显著差异检验对收缩率的比较结果表明 (图5-44),收缩率12与其他收缩率之间有显著差异。 与Fisher最小显著差异法的区别在于临界点,前者为 1.6583,后者为1.2287。

SAS软件与统计应用教程

STAT

SAS软件与统计应用教程

STAT

F—分布的分位点 对于?:0<?<1,

若存在F?(n1, n2)>0,
满足

P{F?F?(n1, n2)}=?, 则
称F?(n1, n2)为 F(n1, n2)的 上侧?分位点;
F? ( n1 , n 2 )

注:F

1??

( n1 , n 2 ) ?

1

SAS软件与统计应用教程

STAT

F? ( n 2 , n1 )
1 F ~ F ( n 2 , n1 )

证明:设F~F(n1,n2),则
P { F ? F1 ? ? ( n1 , n 2 )} ? 1 ? ?

P{
P{ 1 F ? 1 F1 ? ? ( n 1 , n 2 ) } ? 1??

1 F

? F? ( n 2 , n 1 )} ? ?

P{

1 F

?

1 F1 ? ? ( n 1 , n 2 )

}??

得证!


网站首页 | 网站地图 | 学霸百科 | 新词新语
All rights reserved Powered by 大学生考试网 9299.net
文档资料库内容来自网络,如有侵犯请联系客服。zhit325@qq.com