多因素方差分析
定义:
多因素方差分析中的控制变量在两个或两个以上,研究目的是要分析多个控制变量的作用、多个控制变量的交互作用以及其他随机变量是否对结果产生了显著影响。
前提:
1总体正态分布.当有证据表明总体分布不是正态分布时,可以将数据做正态转化。 2变异的相互独立性.
3各实验处理内的方差要一致。进行方差分析时,各实验组内部的方差批次无显著差异,这是最重要的一个假定,为满足这个假定,在做方差分析前要对各组内方差作齐性检验.
多因素方差分析的三种情况:
只考虑主效应,不考虑交互效应及协变量; 考虑主效应和交互效应,但不考虑协变量; 考虑主效应、交互效应和协变量。
多因素方差分析
1选择分析方法
本题要判断控制变量“组别”和“性别”是否对观察变量“数学”有显著性影响,而控制变量只有两个,即“组别”、“性别”,所以本题采用双因素分析法,但需要进行正态检验和方差齐性检验。
一、
2建立数据文件
在SPSS17.0中建立数据文件,定义4个变量:“人名”、“数学”、“组别”、 “性别”。控制变量为“组别”、 “性别”,观察变量为“数学”。在数据视图输入数据,得到如下数据文件:
3正态检验(P>0。05,服从正态分布) 正态检验操作过程:
“分析”→“描述统计”→“探索”,出现“探索”窗口,将因变量“成绩”放入“因变量列表”,将自变量“组别\"、“性别”放入“因子列表\将“人名”放入“标注个案”;
点击“绘制\",出现“探索:图\"窗口,选中“直方图”和“带检验的正态图”,点击“继续”; 点击“探索”窗口的“确定\",输出结果。
因变量是用户所研究的目标变量。因子变量是影响因变量的因素,例如分组变量。标注个案是区分每个观测量的变量。
带检验的正态图(Normality plots with test,复选框):选择此项,将进行正态性检验,并生成正态Q—Q概率图和无趋势正态Q-Q概率图。 表1 控制变量为“组别”的正态性检验 成绩 组别 1 2 3 Kolmogorov—Smirnov 统计量 。116 .145 。147 df 10 10 10 Sig。 。200 。200 .200 ***aShapiro-Wilk 统计量 .969 .961 .918 df 10 10 10 Sig。 .884 。793 .343 a. Lilliefors 显著水平修正 *。 这是真实显著水平的下限。 多因素方差分析
表2 控制变量为“性别”的正态性检验 成绩 性别 0 1 Kolmogorov-Smirnov 统计量 .174 .186 df 15 15 Sig. .200 。170 *aShapiro-Wilk 统计量 .916 .953 df 15 15 Sig. .165 .575 a。 Lilliefors 显著水平修正 *。 这是真实显著水平的下限。 正态检验结果分析:
表1 控制变量为“组别\"的正态性检验结果,Shapiro-Wilk 的p值0.884、0。793、0。343都大于0。05,因而我们不能拒绝零假设,也就是说没有证据表明各组的数据不服从正态分布(检验中的零假设是数据服从正态分布)。即p值≥0.05,数据服从正态分布。
表2 控制变量为“性别”的正态性检验结果,Shapiro—Wilk 的p值0。165、0. .575都大于0。05,因而我们不能拒绝零假设,也就是说没有证据表明各组的数据不服从正态分布(检验中的零假设是数据服从正态分布)。即p值≥0.05,数据服从正态分布.
情况一 只考虑主效应:(包括4、5步)(区别用下划线)
4多因素方差分析操作过程
“分析”→ “一般线性模型”→“单变量”,出现“单变量”窗口,将因变量“成绩”放入“因变量列表”(因变量只能选一个),将自变量“组别”和“性别”放入“固定因子”列表;点击“模型”,出现“单变量:模型\"窗口,点击“设定”,在“构建项”选择“主效应\将“组别”和“性别\"分别放入“模型”列表,点击“继续”,回到主对话框;点击“绘制\出现“单变量:轮廓图”,将“组别\"放入“水平轴”,将“性别”放入“单图\",点击“添加”,点击“继续”,回到主对话框;点击“两两比较”,将“组别”和“性别”放入“两两比较检验”列表,选择“LSD”和“S-N—K” 、“Dunnett’s C”,点击“继续\回到主对话框;点击“选项\"选择“方差同质性检验”和“描述性\点击“继续”,回到主对话框;点击“单变量”窗口的“确定”,输出结果。
5多因素方差分析结果分析
表1 主体间因子
组别
1 2 3
N
10 10 10 15 15 性别 0 1
表2 描述性统计量
因变量:成绩 组别 1
性别 0
均值 91.17 标准 偏差 7。468 N
6 多因素方差分析
1 总计
2
0 1 总计
3
0 1 总计
总计
0 1 总计
87.25 89。60 80。00 83.60 81.80 62。00 70.83 67。30 79.67 79。47 79.57 4。992 6。586 11。958 8.204 9。852 7.616 10.028 9。799 14.802 10.763 12.716 4 10 5 5 10 4 6 10 15 15 30 表3 误差方差等同性的 Levene 检验 因变量:成绩 F 。710 df1 5 df2 24 Sig. 。622 a检验零假设,即在所有组中因变量的误差方差均相等。 a. 设计 : 截距 + 组别 + 性别 表2 描述性统计,组1数学成绩取值范围:平均值±标准差, 表3误差方差等同性的 Levene 检验,P=0。 622>0。05,方差齐性,且正态检验结果为正态分布,所以可以用多因素方差分析。(P值>0.05,方差齐,事后多重比较用“LSD”;否则,方差不齐,事后多重比较用“Dunnett’s C ”; S-N—K法多重比较结果为无差别表达方式,即把差别没有显著性意义的比较组在同一列里) 表4 主体间效应的检验 因变量:成绩 源 校正模型 截距 组别 性别 误差 总计 校正的总计 III 型平方和 2620。532 189925。633 2620.232 59。266 2068.834 194615.000 4689.367 adf 3 1 2 1 26 30 29 均方 873.511 F 10.978 Sig. .000 .000 .000 .396 189925.633 2386.884 1310。116 59。266 79。571 16。465 .745 a。 R 方 = .559(调整 R 方 = 。508) 表4 主体间效应的检验,“组别”P=0。000<0。01,说明“组别”的主效应极显著; “性别”P=0.396>0.05,
多因素方差分析
说明 “性别\" 的主效应不显著。由于“性别”只有两个水平,所以没有“性别\"的事后多重比较.
表5 多个比较 因变量:成绩 LSD (I) 组(J) 组别 1 别 2 3 2 1 3 3 1 2 均值差值 (I—J) 7。80 22.30 -7。80 14。50 —22。30 —14。50 ****95% 置信区间 标准 误差 3。989 3.989 3.989 3。989 3。989 3.989 Sig. 。061 .000 下限 —.40 14.10 上限 16.00 30。50 。40 22.70 —14.10 -6.30 。061 —16。00 。001 6。30 .000 —30。50 。001 -22。70 基于观测到的均值。 误差项为均值方 (错误) = 79。571。 *. 均值差值在 .05 级别上较显著。 表5 多个比较,组1和组2的P=0.061>0。05,说明组1和组2无显著性差异;组1和组3的P=0.000〈0。01,说明组1和组3有极显著性差异;组2和组3的P=0。001〈0.01,说明组2和组3有极显著性差异. 表6 成绩 Student-Newman—Keulsa,,b子集 组别 3 N 10 10 10 1 67。30 2 81。80 89.60 .061 2 1 Sig。 已显示同类子集中的组均值。 基于观测到的均值。 误差项为均值方 (错误) = 79.571。 a. 使用调和均值样本大小 = 10.000。 b。 Alpha = 。05。 1。000 表6 为S-N-K多重比较结果,说明组1和组2无显著性差异,组1和组3有显著性差异,组2和组3有显著性差异。 SNK法多重比较结果是把差别没有显著性意义的比较组在同一列里,有差异的放在不同列里。 每一列最下面有一个“显著性”P值,表示列内部水平的差异的P值;检验水准α=0.05,不同列间差异有显著意义,同列间各组差异无显著意义。 我的前三个浓度之间无显著差异,倒数2-5个浓度之间无差异。
多因素方差分析
情况二 考虑交互效应:(包括4、5步)(区别用下划线)
4多因素方差分析操作过程
“分析”→ “一般线性模型”→“单变量\",出现“单变量”窗口,将因变量“成绩\"放入“因变量列表”(因变量只能选一个),将自变量“组别”和“性别”放入“固定因子”列表;点击“模型”,出现“单变量:模型”窗口,点击“设定”,在“构建项”选择“交互效应”,将“组别”和“性别”分别放入“模型”列表,再同时选定“组别”和“性别\"放入“模型”列表,点击“继续”,回到主对话框;点击“绘制”,出现“单变量:轮廓图”,将“组别”放入“水平轴”,将“性别”放入“单图”,点击“添加”,点击“继续\回到主对话框;点击“两两比较\将“组别”和“性别\"放入“两两比较检验”列表,选择“LSD”和“S-N-K” 、“Dunnett's C”,点击“继续”,回到主对话框;点击“选项”选择“方差同质性检验”和“描述性”,点击“继续”,回到主对话框;点击“单变量”窗口的“确定”,输出结果。
5多因素方差分析结果分析
表1 主体间因子
组别
1 2 3
N
10 10 10 15 15 性别 0 1
表2 描述性统计量 因变量:成绩 组别 1 性别 0 1 均值 91。17 87。25 标准 偏差 7.468 4。992 N 6 4 多因素方差分析
总计 2 0 1 总计 3 0 1 总计 总计 0 1 总计 89。60 80.00 83。60 81.80 62.00 70。83 67.30 79。67 79.47 79.57 6。586 11。958 8.204 9.852 7。616 10.028 9。799 14。802 10.763 12。716 10 5 5 10 4 6 10 15 15 30 表3 误差方差等同性的 Levene 检验 因变量:成绩 F .775 df1 5 df2 24 Sig。 .577 a检验零假设,即在所有组中因变量的误差方差均相等。 a. 设计 : 截距 + 组别 * 性别 + 性别 + 组别 表2 描述性统计,组1数学成绩取值范围:平均值±标准差, 表3误差方差等同性的 Levene 检验,P=0。 577>0.05,方差齐性,且正态检验结果为正态分布,所以可以用多因素方差分析.(P值>0.05,方差齐,事后多重比较用“LSD”;否则,方差不齐,事后多重比较用“Dunnett's C ”; S—N-K法多重比较结果为无差别表达方式,即把差别没有显著性意义的比较组在同一列里) 主体间效应的检验 因变量:成绩 源 校正模型 截距 组别 * 性别 性别 组别 误差 总计 校正的总计 58。811 2597.957 1871.617 194615。000 4689。367 1 2 24 30 29 58。811 1298.979 77。984 .754 16。657 。394 .000 III 型平方和 2817.750 182823.667 197。218 adf 5 1 2 均方 563.550 F 7。226 Sig. .000 。000 。301 182823.667 2344.373 98。609 1。264 a。 R 方 = .601(调整 R 方 = 。518) 多因素方差分析
表4 主体间效应的检验, “组别\"P=0.000〈0.01,说明 “组别”的主效应极显著; “性
别”P=0.394>0.05,说明 “性别\"的主效应不显著;考虑“性别”和“组别”的交互效应,P=0。301>0。05,说明“组别”和“性别” 的交互相应不显著。由于“性别”只有两个水平,所以没有“性别”的事后多重比较.
表5 多个比较 因变量:成绩 LSD (I) (J) 组别 1 组别 2 3 2 1 3 3 1 2 均值差值 (I-J) 7.80 22。30 —7。80 14。50 —22.30 -14。50 ****95% 置信区间 标准 误差 3.949 3.949 3。949 3。949 3.949 3。949 Sig。 .060 。000 .060 。001 .000 。001 下限 —.35 14.15 -15。95 6。35 —30.45 -22。65 上限 15。95 30.45 .35 22。65 -14。15 —6.35 基于观测到的均值. 误差项为均值方 (错误) = 77。984。 *. 均值差值在 .05 级别上较显著。 表5 多个比较,组1和组2的P=0。060>0。05,说明组1和组2无显著性差异;组1和组3的P=0.000〈0。01,说明组1和组3有极显著性差异;组2和组3的P=0。001<0.01,说明组2和组3有极显著性差异。
成绩 Student-Newman-Keulsa,,b子集 组别 3 N 10 10 10 1 67。30 2 81。80 89。60 .060 2 1 Sig. 已显示同类子集中的组均值。 基于观测到的均值。 误差项为均值方 (错误) = 77。984。 a。 使用调和均值样本大小 = 10。000。 b. Alpha = .05。 1。000 表6 为S—N—K多重比较结果,说明组1和组2无显著性差异,组1和组3有显著性差异,组2和组3有显著性差异。 SNK法多重比较结果是把差别没有显著性意义的比较组在同一列里,有差异的放在不同列里。 每一列最下面有一个“显著性”P值,表示列内部水平的差异的P值;检验水准α=0.05,不同列间差异有显著意多因素方差分析
义,同列间各组差异无显著意义。
我的前三个浓度之间无显著差异,倒数2—5个浓度之间无差异。
从均数图可以发现,在不同组中,不同性别学生的数学成绩是不一样的。
6论文中表述(表格或图表) 表1 三组学生的数学成绩的比较 分组 学生数/人 数学成绩 /分(平均值±标准差表1描述性) 学生组1 ±A 学生组2 ±A 学生组3 ±B
注:不同的小写字母间,差异显著;不同的大写字母间, 差异极显著。
组1数学成绩 ± ;组1数学成绩 ± ;组1数学成绩 ± 。组1和组2无显著性差异,组1和组3有显著性差异,组2和组3有显著性差异。
多重比较有几种的方法:符号标记法、标记字母法、列梯形表法、划线法 注:与学生组1比较,*P≤0.05,差异显著;** P<0.01,差异极显著. 注:不同的小写字母间,差异显著;不同的大写字母间, 差异极显著。
因篇幅问题不能全部显示,请点此查看更多更全内容