
2.3 应用SPSS实现协方差分析
在实际应用中可利用SPSS统计软件,来实现协方差分析。下面我们介绍SPSS中协方差分析的具体过程。
我们以表2.2的数据为例,输入到SPSS的数据编辑窗口中(图2.3)。自变量名为“组”,1,2,3表示三个水平。因变量Y,协变量X都是连续变量。
2.3.1 协方差分析的预分析
第一步:进入协方差分析。点击数据编辑窗口顶部的功能键“分析(A)—一般线性模型(G)—单变量(U)”,参见图2.4(括号里的A, G,U分别表示Analysis, General linear model与Univariate的首字母。若使用的SPSS没有汉化,可以对照英文首字母,找到相应的关键字)。
第二步:变量设定。把“Y”选入因变量框,“组”放入固定因子框,再将“X”选入协变量框内,见图2.5。
第三步:模型设定。点击图2.5中的模型(M),进入单变量模型后(见图2.6),点击“设定(C)”选项,将左边的“组”“X”及其交互项“X*组”选入右边框内,然后点击“继续”。
第四步:回到图2.5,点击“确定”之后,输出结果见图2.7。图中第1列为变异源,即各个效应源;第2列是关于各个效应源的离差平方和;第3列为自由度;第4列是均方,即离差平方和与自由度之比;第5列的F值是各类均方与误差均方之比;第6列是显著性系数即p值。

图2.3 表2.2的数据在数据编辑窗口的截图

图2.4 进入协方差分析的示意图

图2.5 变量设定示意图

图2.6 模型选择示意图
图2.7第2列标出的Ⅲ型平方和,是我们初次遇到的概念。计算机统计软件根据研究设计的各种假定以及由多个效应组成的列联表单元格内次数均衡的程度设计了四个计算偏差平方和的方法,分别为类型Ⅰ,Ⅱ,Ⅲ及类型Ⅳ平方和(软件内常设Ⅲ型平方和为默认值)。本章2.6小节有一个较为详细的补充说明,供读者参考。
图2.7中第1列变异源中的“组*X”,是关于两者交互效应的假设检验。查看该行的最后一列“Sig.”,即p值,若p值小于预先设定的显著性水平,如0.05,0.01等,则拒绝无交互效应的原假设,意味着这组数据违反了回归系数同质性的假设,不适用协方差分析;反之,则不存在交互效应,可以做协方差分析。根据图2.7中的交互项检验结果,F(2,18)=1.601,p=0.229>0.05,接受无交互效应的原假设,可以进入下一步的分析过程。

图2.7 回归系数同质性检验
2.3.2 正式实行协方差分析
第五步:重新回到图2.6示意的窗口处,将“组*X”从右框内剔除,点击“继续”。
第六步:返回到图2.5的窗口处点击“选项(O)”,在“输出”栏下选择所需的统计项,最简单地选择如下几项,描述统计、方差齐性检验、参数估计、功效估计等(见图2.8)。点击“继续”;
第七步:回到图2.5,点击“确定”即可。

图2.8 规定协方差分析结果的示意图
第八步:查阅主要结果。SPSS输出结果见图2.9至图2.12。Levene方差同质性检验的结果列于图2.9。从最后一列的p值为0.409可知,三组的误差方差满足方差同质性假设。

图2.9 Levene方差同质性检验
协方差分析的主要结果列于图2.10与图2.11。

图2.10 协方差分析中组间与组内的效应检验

图2.11 参数估计结果
从图2.10知道,协变量X主效应显著(F(1,20)=21.306,p=0.000);自变量主效应显著(F(2,20)=7.786,p=0.003),即剔除协变量影响后,各组的平均分数存在显著性差异。我们注意到尽管误差的自由度减少1,但误差的平方和大幅减少,因此,即使组间效果可能会有所减小,一般F值也会显著增大。该表的最后一列“偏Eta方”(Partial Eta Squared,),它是Cohen(1973)定义的效应量指标,用希腊字母表示。
是该项效应的变异与其误差效应变异之和的比

越大,说明该项效应的影响越大。Cohen(1973)认为
>0.14就可视为效应量大。图2.10中自变量的效应量就是依公式(2.7)算得:

协变量的效应量为:

图2.11的第二列是总平均值μ、组间效应αj和回归系数β的估计结果。其中,μ=6.870,α1=-5.570,α2=1.391,α3=0,β=0.968。于是我们可以写出各组的回归预测方程式:

若将X的平均值11.54代入上面三式,便得到三组因变量Y的估计平均值:

即SPSS输出的最后一张表中的数据,详见图2.12。

图2.12 调整后的各组平均值估计