东北农业大学网络教育学院 田间试验与统计方法网上作业题
作业题一
一、名词解释
1、随机样本:指由总体中随机抽取的个体组成的样本。
2、水平:试验因素通常是可以人为控制的,其数量的不同等级或质量的不同状态称为水平。 3、随机试验:满足下述三个条件的试验称为随机试验,试验可在相同条件下重复进行;试验的所有可能结果是明确可知的,并且不止一个;每次试验总是恰好出现这些可能结果中的一个,但在试验之前却不能肯定会出现哪一个结果。
4、χ2适合性检验:即根据χ2分布的概率值来判断实际次数与预期理论次数是否符合的假设检验。 5、概率:用于度量事件发生可能性大小的数值称作事件的概率。 二、判断,请在括号内打√或×
1、两因素间互作称为二级互作,三因素间的互作为三级互作。(×)
2、由8个小麦新品系和2个对照品种组成3次重复的品比试验,属于单因素试验。(√) 3、设一样本有7个观察值,6、10、9、6、12、7、13,则方差为2.828。(×)
4、实施一个试验在安排区组时原则上应尽可能保持区组内的最大一致性,区组间允许较大差异。(√) 5、将一块环境条件相近的试验田划分成30个面积相同的小区,不再做其他处理,观测某品种小区产量是一个随机试验。(√)
6、若无效假设为H0:μ1=μ2,那么备择假设为HA:μ1≠μ2。(√)
7、进行小麦品种比较试验,6个品种,每品种得到4个产量观察值,则该试验具有品种间自由度为3,误差自由度为20。(×)
8、方差分析中,F检验后就进行平均数的多重比较。(×) 9、相关系数(r)和回归系数(b)都是带有单位的。(×)
10、某样本观察值为17,13,21,10,19,9,11,8,则该样本的中数为14.5。(×) 三、填空
1、农业科学试验的基本任务是研究各种农业科学理论和技术,考察研究结果的实际表现,客观地评价其推广价值和应用范围,主要包括(品种)试验、(丰产)试验、(耕作)试验、(植保)试验和(土肥)试验。
2、在田间试验过程引起差异的外界因素中,(土壤)差异是最主要的,必须加以适当的控制。
3、设一样本有5个观察值,6、8、9、12、13,则x=(9.6),s=(2.88),sx=(1.29),CV=(30%)。 4、已知甲,乙两批水稻品种种子的发芽率分别为0.9和0.8, 甲,乙种子各取一粒,做发芽试验,试问有两粒发芽的概率为( 0.72 ),至少有一粒发芽的概率为( 0.98),两粒都不发芽的概率为(0.02) 。 5、反映资料集中性的特征数是(平均数),反映资料离散性的特征数是(变异数)。
四、单项选择
1、根据研究目的拟定的进行比较的一组处理,在相同试验条件下试验,所得各处理平均数值与试验总平均值之差,称为( C )。
实用文档
A. 离差 B. 误差 C. 处理效应 D. 每组内离差 2、农业试验中应用最多的平均数是( A )。
A. 算术平均数 B. 几何平均数 C. 调和平均数 D. 中数和众数
3、比较番茄的单果重量(g)和体积大小(cm)的变异程度,适宜的统计数是(D )。 A. 极差 B. 方差 C. 标准差 D. 变异系数 4、下列描述不属于正态分布特征的是( D )。
A. 左右对称 B. 单峰分布 C. 中间大两头小 D. 概率处处相等
5、对一批棉花种子做发芽试验,抽样1000粒,得发芽种子890粒,若规定发芽率达90%为合格,这批种子的检验结果与合格种子发芽率90%的差异为( A )。 A. 不显著 B. 显著 C. 极显著 D. 不好确定
6、对金鱼草花色进行遗传研究,以红花亲本和白花亲本杂交,F1为粉红色,F2群体有3种表现型:红花196株,粉红花419株,白花218株。检验F2分离比例是否符合1:2:1的理论比例的分析方法是( D )。 A. 方差的同质性检验 B. F检验 C. 独立性检验 D. 适合性检验 7、在多因素试验中,每一个( A )是一个处理。 A. 水平组合 B. 水平 C. 处理 D. 组合
8、根据某地区1985-2005年间小麦单位面积产量及秋季降雨量的关系,计算得r = -0.632,这一结果表明( B )。(r 0.01,18=0.561,r0.01,19 =0.549) A. 小麦单位面积产量与秋季降雨量无关
B. 小麦单位面积产量随秋季降雨量的增加极显著地减少 C. 小麦单位面积产量随秋季降雨量的增加而增加 D. 小麦单位面积产量随秋季降雨量的减少而增加 9、属于算术平均数重要特性的是( A )。 A. (xx)0 B.(xx)0
2222C.(xx)(xa) D.(xx)(xa)
2
10、决定系数r的取值范围为( A )。
3
A. [ 0,1 ] B.( 0,1 ) C. [ -1,1 ] D. ( -1,1 )
五、简答
1、试验方案的设计要点 (1)明确试验目的
(2)确定合理的试验方案
(3)确定合理的水平数和水平间距 (4)贯彻唯一差异原则 (5)设置对照 (6)正确处理试验因素及试验条件间交互作用 2、何谓定量资料、定性资料?各有何特点?
定量资料指对数量性状进行测量或称量得出的数据,如重量、长度等。特点:定量资料一般呈连续的变异分布。
定性资料指对质量性状记数或分组记数得出的数据,如发芽和不发芽粒数、害虫头数等。特点:定性资料一般呈不连续的间断分布。
3、以随机区组试验设计为例说明方差分析中为何将总变异进行分解?为何将自由度和平方和进行分解? 随机区组试验设计中总变异由区组间变异、处理间变异和误差三项组成,将总变异进行分解能够发现各项变异对方差的贡献大小,进而能够发现起重要作用的变异因素。 方差的概念是用观察值的数目来除平方和,
实用文档
,式中,(n−1)为自由度,SS为平方和,为获得各项变异来源的方差,需要将
各项变异来源的自由度和平方和进行分解。
六、计算
1、选面积相同的玉米小区10个,各分成两半,一半去雄另一般不去雄,产量结果见下表,试测验两种处理产量的差异显著性。(t0.05,9=2.262)
玉米去雄与不去雄成队产量数据表
区号 1 2 3 4 5 6 7 8 9 10
去雄(x1i) 14.0 16.0 15.0 18.5 17.0 17.0 15.0 14.0 17.0 16.0
不去雄(x2i) 13.0 15.0 15.0 17.0 16.0 12.5 15.5 12.5 16.0 14.0
解:数据整理
区号 去雄(x1i) 不去雄(x2i) d( ix2i—x1i)1 14.0 13.0 +1 2 16.0 15.0 +1 3 15.0 15.0 0 4 18.5 17.0 +1.5 5 17.0 16.0 +1 6 17.0 12.5 +4.5 7 15.0 15.5 -0.5 8 14.0 12.5 +1.5 9 17.0 16.0 +1 10 16.0 14.0 +2
(1)假设。H0:μd =0;对HA:μd ≠0; (2)显著水平α=0.05;
(3)计算
dd1分) x1(x2 =1.3n
isd
(did)2n1d2i(di)2nn1SS=1.338 d n1实用文档
sdsSS =0.423 dnn(n1)2dd2inn(n1)(di)2td =3.07 Sd(4)推断。实得| t |=3.07,t0.05,9=2.262,所以| t |>t0.05(1分)。否定H0,即玉米去雄与不去雄产量差异显著。
2、(1)补充方差分析表 变异来df SS S2 F F0.05 F0.01 源
区组间 (2) 14.8751 (7.4286) (2.802) 3.89 6.9
3
处理间 (6) 367.9047 (61.3175) (23.131)(**3.00 4.8
) 2
误差 (12) (31.8096) (2.6508) 总变异 (20) 414.5714
2、有一橡胶品比试验,有A、B、C、D、E、F、G,7个品种,其中B为对照,采用随机区组设计,3次重
2
复,小区计产面积600m,根据产量结果进行方差分析。请回答以下问题。 (1)补充方差分析表 变异来源 区组间 处理间 误差 总变异
df ( ) ( ) ( ) ( )
SS 14.8751 367.9047 ( ) 414.5714
S2 ( ) ( ) ( )
F ( )
( )( )
F0.05 3.89 3.00
F0.01 6.93 4.82
(2)根据方差分析表,请说明处理间由F检验得到的结论。 (3)多重比较(SSR法) ①计算小区平均数比较的sx se2n4
5
6
7
②橡胶品比试验产量平均数的LSR值表
p 2 3
SSR0.05 3.08 3.22 3.31 3.37 3.41 3.44 SSR0.01 4.32 4.50 4.62 4.71 4.77 4.82 LSR0.05 ( ) ( ) ( ) ( ) ( ) ( ) LSR0.01 ( ) ( ) ( ) ( ) ( ) ( ) ③橡胶品比试验品种平均产量比较表
品种 A
小区平均产量
0.05
49.7
差异显著性
0.01 ( )
( )
实用文档 G F D E B(CK) C
④试验结论
48.7 45.3 45.0 41.0 39.0 38.3 ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )
(1)补充方差分析表 变异来df SS 源
区组间 (2) 14.8751 处理间 (6)
367.9047
S2 (7.4286) (61.3175)
F (2.802)
F0.05 F0.01 3.89 6.9
3
3.00 4.8
2
(23.131)(**
)
误差 (12) (31.8096) (2.6508) 总变异 (20) 414.5714
(2)根据方差分析表,请说明处理间由F检验得到的结论。
品种间F> F0.01,故在α=0.01的水平上接受HA,说明7个品种的平均数有极显著的差异。 (3)多重比较(SSR法) ①计算小区平均数比较的sx se2nsxse2=0.94(1分) n5 3.37 4.71 3.17 4.43 6 3.41 4.77 3.21 4.48
7 3.44 4.82 3.23 4.53
②橡胶品比试验产量平均数的LSR值表
p 2 3 4 SSR0.05 3.08 3.22 3.31 SSR0.01 4.32 4.50 4.62 LSR0.05(22.90 3.03 3.11 分) LSR0.01(24.06 4.23 4.34 分) ③橡胶品比试验品种平均产量比较表 品种 小区平均产量 A G F D E B(CK) C
④试验结论
49.7 48.7 45.3 45.0 41.0 39.0 38.3
差异显著性 0.05(2分) 0.01(2分)
a A a AB b BC b C c CD c D c D
实用文档
A品种与G品种平均产量无显著差异,A和B的产量显著高于F、D、E、C和B品种,A品种极显著高于其他品种,F、D品种显著高于B、C品种,而其他品种产量间差异均不显著。
作业题二
一、名词解释
1、空白试验法:是在整个试验地上种植某作物的单一品种,通过测产来判定土壤差异。 2、准确度:试验中某一性状的观察值与相应理论真值接近的程度称为试验的准确度。 3、小区:在田间试验中,小区指安排一个处理的小块地段。
4、统计假设检验:就是运用抽样分布等概率原理,利用样本资料检验这些样本所在总体(即处理)的参数有无差异,并对检验的可靠程度做出分析的过程。
5、随机试验:满足下述三个条件的试验称为随机试验,试验可在相同条件下重复进行;试验的所有可能结果是明确可知的,并且不止一个;每次试验总是恰好出现这些可能结果中的一个,但在试验之前却不能肯定会出现哪一个结果。
二、判断,请在括号内打√或×
1、不论哪种类型的田间试验,所设的水平就是处理。(×)
2、在随机区组设计中,增加重复而扩大试验田面积,区组间土壤差异增大,这将导致因土壤差异而带来试验误差的增大。(×)
3、试验设计三项原则,其中重复和局部控制的作用是无偏地估计试验误差。(×) 4、随机区组设计试验中,区组数等于重复次数。(√)
5、若做100次随机试验,一个事件出现20次,则事件的近似概率是0.2。(√) 6、样本容量n指一个总体中变量的个数。(×)
7、变异系数能用来直接比较两个单位不同或平均数相距较远的样本。(√)
28、3个大豆品种产量比较试验中,得到se=75,st2=12.5,则F值为75/12.5=6。(×)
9、决定系数(r)既可表示相关的程度,又可表示相关的性质。(×)
10、番茄重量(x)和番茄直径(y)的相关系数r = 0.7495,表明番茄重量的变异平方和有74.95%是番茄直径的不同所造成。(×) 三、填空
1、试验设计因素的水平间距要适当,常用的确定水平间距的方法有(等差法)、(等比法)、(随机
2法)和优选法等。
2、进行小麦品种比较试验,6个品种,每品种得到4个产量观察值,则该试验具有品种间自由度为( 5),误差自由度为(18 )。
3、算术平均数的计算方法有(直接)法和(加权)法。
4、在0,1,2,3,4,5,6,7,8,9中随机抽取一个数字,设A为抽取的数字≤5,则P(A)=(0.6 )。
ˆabx ,其中a叫(回归截距),b叫(回归系数)。 5、直线回归方程通式为y
四、单项选择
1、用于反映资料离散性的特征数是( B )
实用文档
A.变异系数 B.变异数 C.方差 D.标准差 2、下列统计数不属于变异数的是( D )
A.极差 B.变异系数 C.标准差 D.众数
3、进行田间试验时,作为试验地必须具备( B )两个基本条件。
A. 准确性和精确性 B. 均匀性和代表性 C. 精确性和均匀性 D. 准确性和均匀性
4、要正确地制定一个试验方案,必须作到研究目的明确,处理水平简明合理,并必须在所比较的处理之间应用( C )原则。
A. 设立对照 B. 全面实施 C. 唯一差异 D. 相差等距或等比例
5、进行玉米品种比较试验,7个品种,每品种得到3个产量观察值,则该试验误差自由度为( A ) A.14 B.18 C.6 D.2
6、用黄子叶豌豆品种与绿子叶豌豆品种杂交,随机调查F2代中的1行,其中黄子叶的22株,绿子叶的7株,检验F2代黄子叶与绿子叶的分离是否符合31的分离定律的分析方法是( D ) A.方差的同质性检验 B.F检验 C.独立性检验 D.适合性检验
7、用标记字母法表示的多重比较结果中,如果两个平均数的后面,既标有相同小写拉丁字母,又标有不同小写拉丁字母,则它们之间差异( C )。 A.在0.05水平上显著 B.在0.01水平上显著 C.在0.05水平上不显著 D.在0.01水平上不显著 (sp)28、是( C )。
ss.ssxyA.相关系数 B.回归系数 C.决定系数 D.回归平方和
9、对水稻的茎杆产量x(克)和稻谷产量Y(克)进行测定,将获得的15对观察值标在直角座标平面上,正确计算结果是( B )。
ˆ0.50911.0548x(r=1.0031) A.yˆ0.50911.0548x(r=0.9902) B.yˆ0.50911.0548x( r=-0.9902) C.yˆ0.50911.0548x( r=-0.9902) D.y10、相关系数r的取值范围为( C )。
A. [ 0,1 ] B.( 0,1 ) C. [ -1,1 ] D. ( -1,1 ) 五、简答
1、农业科学试验的基本要求
(1)试验目的的明确性 (2)试验条件的代表性 (3)试验结果的可靠性 (4)试验结果的重演性
2、何谓无效假设、备择假设?二者有何关系?
实用文档
无效假设也叫零假设,就是假设总体参数与某一定值相等或假设两个总体参数相等,即无差别或无效应的假设。备择假设也叫对应假设,是无效假设被否定后必然要接受的假设。无效假设与备择假设是一对对立事件,二者构成完全互斥事件系,因此,备择假设是一系列与无效假设相对立假设的集合,而不是一个单独的假设。
3、方差分析表中F值右上角的“*”或“* *”各为何意?若F值显著,为何需进行多重比较?
F值右上角的“*”或“* *”分别表示F值达到0.05水平和0.01水平显著,即F值达到显著或极显著(2分)。F值达到显著或极显著,我们就认为相对于误差变异而言,试验的总变异主要来源于处理间的变异,试验中各处理平均数间存在显著或极显著差异,但并不意味着每两个处理平均数间的差异都显著或极显著,也不能具体说明哪些处理平均数间有显著或极显著差异,哪些差异不显著。因而有必要进行两两处理平均数间的比较,以具体判断两两处理平均数间的差异显著性。多个平均数两两间的相互比较即是多重比较。
六、计算
1、今有一待收获果园,种有10万株果树,为与客户签定销售合同需对果园总产量进行估计,现对果园进
行抽样得单株产量(kg):23、21、23、27、20、28、40、32、20、22、17、15、25、28、22、23、24、17、20、19。 (1) 试计算其统计数:xssss2sxcv(10分)
(2) 作置信度为95%的单株平均产量区间估计。其中:t0.05,19=2.093(5分)
解:(1)统计数
ss624.20s232.85x23.30s5.73sx1.28cvs100%24.59% x(2)总体单株平均产量95%区间估计
上限=xt0.05,19sx23.302.0931.2825.98(kg) 下限=xt0.05,19sx23.302.0931.2820.62(kg) 该果园总产量95%估计区间为[20..62,25.98](kg)
2、2004年湖南杂交水稻新组合比较试验,参试组合8个,分别用V1,V2,V3,V4,V5,V6,V7,V8表示,
2
其中V8为对照,采用随机区组设计,重复3次,小区计产面积20m,根据产量结果进行方差分析。请回答以下问题。
(1)补充方差分析表 变异来源 区组间
df ( )
SS 2.432500
S2 ( )
F ( )
F0.05 3.89
F0.01 6.93
实用文档 处理间 误差 总变异 ( ) ( ) ( )
( ) ( ) 20.294167 ( ) 187.41625 0 ( )( ) 3.00 4.82
(2)根据方差分析表,请说明处理间由F检验得到的结论。 (3)多重比较(SSR法) ①计算小区平均数比较的sx se2np 2
3 3.18 4.42
4 3.27 4.55
5 3.33 4.63
6 3.37 4.70
7 3.39 4.78
②杂交水稻新组合试验产量平均数的LSR值表 SSR0.05 3.0
3
SSR0.01 4.2
1
LSR0.05 LSR0.01
③杂交水稻新组合试验品种平均产量比较表
品种
小区平均产量 差 异 显 著 性 (kg)
V7 V4 V3 V5 V2 V1 V6 V8(CK)
④试验结论
20.3 17.3 16.7 15.3 14.3 13.7 12.7 11.6
0.05
0.01
解:(1)补充方差分析表 变异来源 区组间
DF (2)
SS MS F (0.839)
F0.05 F0.01 3.81 6.7
0
2.432500 (1.216250)
处理间 (7) (164.689583) (23.527083) (16.230)(**) 2.76 4.2
8
实用文档 误 差 (14) 总变异 (23)
20.294167 (1.449583) 187.416250
(2)根据方差分析表,请说明处理间由F检验得到的结论。
F>F0.01 , 故在α=0.01的水平上接受HA,说明8个供试品种的总体平均数有极显著差异。 (3)多重比较(SSR法) ①计算小区平均数比较的sx 2sxSe/rse2n =1.449583/30.695122
②杂交水稻新组合试验产量平均数的LSR值表
p SSR0.05 SSR0.01 2 3 4 5 6 7
3.03 3.18 3.27 3.33 3.37 3.39 4.21 4.42 4.55 4.63 4.70 4.78
2.210 3.072
2.273 3.163
2.315 3.218
2.34
2.35
LSR0.05(2分) 2.10
6
3 6 3.26
3.32
LSR0.01(2分) 2.92
6
7 3
③杂交水稻新组合试验品种平均产量比较表
品种
小区平均产量 (kg)
V7 V4 V3 V5 V2 V1 V6 V8(CK)
20.3 17.3 16.7 15.3 14.3 13.7 12.7 11.6
差 异 显 著 性 0.05(2分) 0.01(2分)
a b b bc cd cde de e
A B BC BCD BCDE CDE DE E
④试验结论
V7品种平均产量极显著差异高于其他品种平均产量;V4和V3的产量极显著高于V1,V1和V6;而其它品种产量间均无显著差异。
实用文档
作业题三
一、名词解释
1、精确度:把试验中某一处理的重复观察值之间彼此接近的程度称为精确度。 2、个体:是试验研究中的最基本的统计单位,可从中获得一个观察值。
3、边际效应:是指小区两边或两端的植株因占有较大空间和土地而表现的生长优势。 4、基本事件:随机试验的每一个可能结果,称为基本事件。
5、小概率事件实际上不可能性原理:概率很小的事件,在一次试验中几乎不可能发生或可认为不可能发生。
二、判断,请在括号内打√或×
1、在统计学中,标准差和标准误都是衡量资料变异程度的统计量,他们之间没有区别。(×) 2、拉丁方设计试验的处理数、重复次数、区组数不相等。(×) 3、显著水平越高,抽样估计误差越大,估计越不准确。(√)
4、生物统计可以帮助我们解决任何问题,且其推断结果是百分之百的正确。(×)
5、当样本容量一定时,95%的估计区间的精确度低于99%的精确度,而可靠性高于99%估计区间的可靠性。(×)
6、t0.01,13表示自由度等于13,显著水平为0.01的t测验临界值。(√) 7、在无交互作用时,试验因素彼此独立,简单效应等于主效应。(√) 8、用总体的全体观察值计算的、描述总体的特征数称为参数。(√) 9、同一资料相关系数(r)和决定系数(r)符号必定一致。(×)
210、某试验资料中,已算得 se=6.8,处理重复数n=4,若采用SSR检验法,则可进一步求得其处理平均
2数的标准误值为1.3038。(√) 三、填空
1、试验设计的三个基本原则是(重复)、(随机排列)和( 局部控制 )。
ˆ=1.9904+0.8432x,则其中1.9904称为(回归截距 ),0.8432称为(回归系2、有一直线回归方程y数)。
3、(顺序排列设计)试验的统计分析一般采用百分比法。
4、有一牧草品种磷肥肥效试验,其处理有:N(不施磷肥);P(施磷肥);产量分别为1000kg和1150kg。则:磷的简单效应等于(150)kg。
5、(决定系数)即相关系数r的平方值,r的大小表示相关的(程度)。
2
6、用于衡量试验效果的指示性状称(试验指标)。
7、具有A、B、C、D 4种药剂处理玉米种子,其中A为对照,完全随机设计,每处理各得4个苗高观察值,其DFt=( 3 ),DFe= ( 12)。
实用文档
8、田间试验设计中,完全随机设计适用的试验环境是(均匀一致);随机区组设计适用的试验环境是(单
方向有差异)。
9、正态分布有两个参数,(平均数)和标准差。
10、两个或两个以上变量之间的关系可分为函数关系和(统计 )关系。 11、总体包括全部个体的数目称为(总体容量),用( N )表示。 12、反映资料集中性的特征数是( 平均数)。
13、次数分布表中,每组最大观察值与最小观察值的差数称为(组距 )。
四、单项选择
1、有一两因素试验,其中A有3个水平,B有5个水平,则该试验的处理数为( C )。
A. 125 B. 243 C. 15 D. 30
2、测得玉米品种川单13号5个小区的产量(x)分别为:12.0,11.5,12.5,11.0,11.5(㎏),则( D )。
A. B. C. D.
(x11.7)0,(x11.7)>(x11.0) (x11.7)0.5,(x11.7)(x11.0)2 (x11.7)0,(x11.7)(x11.0)2 (x11.7)0,(x11.7)(x11.0)2
222222223、 关于测验,下列叙述中错误的是( D )。
A. 测验可以进行适合性检验; B. 测验可以进行独立性测验
C. 测验可以进行方差的同质性测验 D. 测验所用的分布是一个对称分布 4、两个样本平均数的差异显著性检验达“显著”意味着( C )。
A. 两个样本平均数相差很大; B. 接受无效假设 C. 两个样本平均数的差数在0.05水平下是客观存在的 D. 否定备择假设 5、关于试验误差的叙述,错误的是( D )。
A. 试验误差客观存在的 B. 试验误差方差是可以估计的 C. 试验误差是可以通过合理的试验设计来降低的 D. 试验误差是人为可以克服的。 6、卡方()检验在( B )时须作连续性矫正。
A.自由度df B.自由度df1 C.独立性检验 D.适合性检验
7、某样本有17个观测值,进行该样本的平均数与总体平均数的显著性检验时,若计算的t值为8.71(已知t0.05(16)2.120),则( A )。
2222实用文档
A.否定无效假设 B. 接受无效假设 C.否定备择假设 D. 无法作出统计推断
8、若算得一双变数资料,x与y的直线相关系数为r0.62,经假设测验接受HO:0,则表明( D)。
A.y与x呈线性负相关 B:y随x的增加而增加 C.y与x无任何关系 D:y与x无线性关系 9、事件的概率取值范围是( B )。
A. [-1,0] B. [0,1] C. [-1,1] D. (-1,1)
10、一样本有如下10个观测值:3.5,3.8,4.5,6.7,2.0,5.5,8.0,8.5,4.9,5.0,则该样本的极差(全距)为( D )。
A. 8.5 B. 2.0 C. 10.5 D. 6.5 五、简答
1、对比法和间比法试验为何不能正确地估计试验误差?试验结果要如何分析?
对比法和间比法试验设计各供试处理是按一定的顺序排列而不是随机,所以不能正确地估计
出无偏的试验误差。
对比法试验设计是每一处理均直接排列于对照处理旁边,每隔两个处理设置一对照。处理与对照相邻,可以认为两者所处环境条件一致。因此,供试处理的目标性状的优劣与其邻近对照处理直接比较。若供试处理的目标性状如产量高于对照10%以上,即认为该处理优于对照。
间比法试验设计是相隔若干个相同数目的处理设置一对照。因此,供试处理的目标性状不能直接与邻近对照比,而与理论对照标准比较,计算相对于理论对照标准的百分比。理论对照标准等于供试处理前后对照目标性状的平均数。同样,若供试处理的目标性状如产量高于理论对照标准10%以上,即认为该处理较优。
2、土壤差异的形成原因
一方面是由于土壤形成的基础不同,以致于土壤在物理性质和化学性质方面有很大差异;另一方面是由于土壤利用上的差异。
3、土壤差异的形式
一种是肥力高低变化,较有规律,即其肥力从试验田的一边到另一边是逐渐改变的;另一种是斑块差异,田间有明显的肥力差异斑块,面积的大小及肥力分布无一定规律。
4、土壤差异的估测方法
目测法;“空白试验”法。
六、计算
1、当甘蔗某种可溶性物质浓度等于或大于4.5mg/kg时,需对棉蚜虫进行防治,现对一蔗田进行观测得以下数据:
实用文档 4.5
4.4
4.5
5.1
4.7
4.4
4.8
5.3
4.4
4.5
5.3
5.2
4.6
4.3
4.5
试分析是否需对该田进行防治?(注:已查出两尾的t值,t0.05,15=2.131 t0.10,15=1.753 t0.05,14=2.145 t0.10,14=1.761)
解:(1)H0:04.5 HA:>0
(2)α=0.05 (1分) (3)计算x,x = 4.70 (1,y,分y) S = 0.35 (2分)
txu0S/n=4.704.500.35/152.21
t=2.21 > t0.05,14=1.761 (1分),故接受HA,差异显著(a=0.05)。结论:认为该甘蔗地应该立即进行防治。
2、已知一组X、Y双变数资料如下:
X Y 已算出
3 5 6 8 10 12 14 15 18 20 1 2 2 3 2 4 3 4 4 5
xy391 。试求(1)回归方程 (2)计算决定系数。 n10x111x1523x11.1xy391y30y104y322ssx290.9000sp0.1994ssxssy14.0000
spxyxy/n58.0000baybx0.7869ˆ0.78690.1994x回归方程为:yr
sp0.9088
ssxssy3、假设某一试验资料结果分析已经计算出了多重比较的最小极显著极差值—LSR表,试用标记字母法将多重比较的结果表示出来。
实用文档
P 2 3 4 5
LSR0.05 3.90 4.10 4.22 4.29
LSR0.01 5.41 5.67 5.84 5.94
该资料各处理平均数的差异显著性
差异显著性
处理 D C A B E
平均数
0.05
131.5 128.5 127.0 124.5 120.0
( ) ( ) ( ) ( ) ( )
0.01 ( ) ( ) ( ) ( ) ( )
差异显著性检验表 处理
平均数
D C A B E
131.5 128.5 127.0 124.5 120.0
差异显著性 0.05 a ab b b c
0.01 A AB AB BC C
作业业题四
一、名词解释
1、完全随机设计:每一个供试处理完全随机地分配给不同的试验单元的试验设计。
2、处理效应:试验处理对试验指标所起的增加或减少的作用称为处理效应。 3、显著水平:是统计假设检验中,用来检验假设正确与否的概率标准,一般选用0.05或0.01,记作。
4、χ2独立性检验:这种根据次数资料判断两类因素彼此相关或相互独立的假设检验就是独立性检验,亦称列联表分析。
5、方差分析:是从方差的角度分析试验数据,将总变异的自由度和平方和分解为各个变异来源的相应部分,从而获得不同变异来源总体方差估计值,并以方差作为衡量各因素作用大小的尺度,通过方差的显著性检验——F检验,揭示各个因素在总变异中的重要程度,进而对各样本总体平均数差异显著性作出统计推断。
二、判断,请在括号内打√或×
1、田间试验在同一重复区内土壤肥力应尽量一致。(√)
2、将供试处理按一定的顺序排列,每隔几个处理设置一对照作为比较的标准,称为随机排列试验。(×) 3、试验设计三项原则,其中重复和局部控制的作用是无偏地估计试验误差。(×) 4、在边际效应明显的试验中,狭长形小区是有利的。(×)
5、若事件A与事件B至少一个发生某事件就发生,则某事件称作A与B的和事件。(√)
实用文档
k(OE)2i6、次数资料的 检验,当df=1时, 检验的公式为i。(×)
Eii2
2
27、有严重斑块差异的地块不宜用作试验地。(√)
8、某样本观察值为17,13,21,10,19,9,11,8,则该样本的中数为14.5。(×) 9、单因素随机区组试验设计进行方差分析,总变异可以分解为处理间变异和误差两项。(×)
ˆabx ,其中x是自变量,yˆ是与x的量相对应的依变量y的点估计值;a10、直线回归方程通式为y叫回归截距,b叫回归系数。(√) 三、填空
1、试验设计的目标是避免(系统)误差,缩小(随机)误差,以保证试验的(准确)度和(精确)度。
ˆ=1.9904+0.8432x,则其中回归截距为(1.9904),回归系数为(0.8432)。 2、有一直线回归方程y3、有一小麦品种氮肥肥效试验,其处理有:O(不施氮肥);N(施氮肥);产量分别为350kg和450kg。则:氮的简单效应等于( 100)kg。
4、统计学上进行假设检验的依据是(小概率事件实际上不可能性原理)。 5、在直线相关分析中,r为相关系数,r为(决定系数)。
2
6、常用的顺序排列试验设计有(对比设计)和(间比设计)。
7、用来表明资料中的观察值相对集中的中心位置的特征数是(平均数)。 8、统计假设测验中直接测验的是(无效 )假设,它与(备择)假设成对立关系。 9、观察值与算术平均数的差数称为(离均差),其总和为( 0 )。 10、正态分布曲线共有( 2 )个拐点。
11、已知SSx64,SSy9,SP16,则有b(0.25 ),r(0.6667 )。 12、方差分析中各处理与对照相比较时,适宜采用的多重比较方法是(最小显著差数法)。
四、单项选择
1、有一两因素的田间试验,A因素有4个水平,B因素有5个水平,则该试验有( C )个水平组合(处理)。
A. 4 B. 5 C. 20 D. 0
2、描述一个小麦品种穗长的分布特征时,适宜采用的统计图为( A )。 A.方柱形图 B.多边形图 C.条形图 D.饼图 3、如果事件A1和A2不能同时发生,则A1和A2称为( D )。 A、和事件 B、积事件 C、对立事件 D、互斥事件
4、一样本有如下5个观测值:5.0,6.0,6.5,5.5,7.0,则该样本的平均数为( C )。
A.5 B.6.5 C. 6.0 D.5.5
5、如果样本有10个观测值,则该样本的样本容量和自由度分别为( B )。
A.10和0 B.10和9 C.0和10 D.0和9
6、正态分布曲线与横轴之间所包围图形的面积等于( D )。
实用文档
A、次数总和n B、次数总和n+1 C、0.95 D、1.00 7、相关系数r的取值范围是( C )。
A. [0,1] B. [-1,0] C. [-1,1] D. (-1,1) 8、若一资料相关系数r=0.9,则说明( B )。
A. x和Y的变异可以相互以线性关系说明的部分占90% B. x和Y的变异可以相互以线性关系说明的部分占81% C. x和Y的变异可以相互以线性关系说明的部分占10% D. x和Y的变异可以相互以线性关系说明的部分占1r=19%
9、统计推断某参数在区间[L1,L2]内的置信度为95%,则其显著水平是( B )。
A.0.01 B.0.05 C.0.90 D.0.95
10、选面积为20m的玉米小区3个,各分成两半,一半抽雄辅助授粉,另一半不抽雄不辅助授粉,若要检验两处理产量的差异显著性,应采用( C )的处理方法进行比较。
A成组数据 B. 百分数 C.成对数据 D. 二项资料 五、简答
1、有一小麦栽培试验,供试品种为甲、乙、丙三个,播期为9月30日和10月10日,试写出该试验的各处理名称。
2
2①甲品种,9月30日播;②甲品种,10月10日播;③乙品种,9月30日播;④乙品种,10月10日播;⑤ 丙品种,9月30日播;⑥ 丙品种,10月10日播。 2、什么是平均数?答:平均数是反映资料集中性的特征数。 平均数是反映资料集中性的特征数。
3、平均数在统计上有什么用途?
平均数的作用 :(1)指出一个资料中观察值的中心位置;
(2)作为一个资料的代表数与另一资料进行比较,以明确它们之间的差异。
4、常用的平均数有哪些类型?
常用的平均数有算术平均数、几何平均数、中数、众数及调和平均数。
六、计算
1、调查某果园18年龄苹果梨树的树体情况,得结果如下表,试比较东西冠径、南北冠径、树高及干周的整齐度。
苹果梨树体情况调查表
株号
1
2
3
4
5
6
7
8
9
10 494
东西冠径(cm) 530
480 480 666 598 620 554 591 507
实用文档 南北冠径(cm) 504 树高(cm) 干周(cm)
472 49
454 600 510 507 48
61
665 527 544 468 60
76
549 559 544 554 74
77
593 638 644 646 73
58
575 539 54
答: 苹果梨树体情况计算结果
调查性状 东西冠径
南北冠径 树高 干周
平均数(x)(cm) 标准差(s)(cm) 变异系数(CV)
(%)
552(1分) 64.55(1分) 11.69(1分) 566.4(1分) 62.54(1分) 11.04(1分) 542.8(1分) 61.46(1分) 11.32(1分) 63(1分) 11.19(1分) 17.76(1分)
以变异系数进行比较,以干周的变异程度最大,其次是东西冠径、树高,南北冠径的变异程
度最小。
2、 甘肃天水连续9年测定3月下旬至4月中旬平均温度累积值(x,旬.度)和甘蓝小菜蛾盛发期(y)的关系共如下表所示,请建立x依y的直线回归方程。
累积温(x,旬.度)和甘蓝小菜蛾盛发期(y)的数据表
数据 SSx SSy SP x 37.08 y 7.78 SP 25293.72 2SSx 12.03 144.63 249.56 -159.04
b SP/SSx 159.04/144.63 1.10(d/旬.度) aybx= 7.78(1.10×37.08) = 48.57(d) 即直线回归方程为:Ŷ= 48.571.10 x
3、 利用相关系数法对上题(2题)建立的直线回归方程进行显著性测验(r0.01,8=0.765,r0.05,8=0.632,
r0.01,7=0.798, r0.05,7=0.666)。
答:计算相关系数r
rSPSSxSSy159.040.837
144.63*249.56相关系数r结果说明,甘肃天水甘蓝小菜蛾盛发期与3月下旬至4月中旬平均温度累积值呈负相关,即3月下旬至4月中旬平均温度累积值愈高,甘蓝小菜蛾盛发期愈提早。
推断:因为| r | =0.837>r0.01,7=0.798(2分),所以r在α = 0.01水平上极显著。因此,建立的直线回归方程有意义。
作业题五
一、名词解释
实用文档
1、区组:将一个重复的全部小区分配于具有相对同质的一小块土地上,称为一个区组。 2、总体:由统计研究的目的而确定的同类事物或现象的全体。
3、唯一差异原则:在进行处理间比较时,除要比较的差异外,其它条件应当完全一致。 4、连续性矫正:χ2是连续分布,而次数资料是间断性的,由χ2检验的基本公式计算的χ2值均有不同程度偏大的趋势,尤其在df = 1时偏差较大。为此,需对χ2进行连续性矫正使之符合χ2的理论分布。
5、统计假设检验:就是运用抽样分布等概率原理,利用样本资料检验这些样本所在总体(即处理)的参数有无差异,并对检验的可靠程度做出分析的过程。
二、判断,请在括号内打√或×
1、随机区组设计遵循试验设计原则的重复、随机排列和局部控制三项原则。(√) 2、试验设计三项原则,其中重复和随机排列的作用是有效地降低试验误差。(×) 3、变异系数能用来直接比较两个单位不同或平均数相距较远的样本。(√) 4、在边际效应明显的试验中,方形小区是有利的。(√)
5、设一样本有7个观察值,6、10、9、6、12、7、13,则方差为2.828。(×)
6、单因素完全随机试验设计进行方差分析,总变异可以分解为处理间变异、区组间变异和误差三项。(×) 7、马铃薯直径(x)和马铃薯单个块茎重 (y)的相关系数r = 0.8,表明马铃薯单个块茎重的变异平方和有64%是马铃薯直径的不同所造成。(√)
ˆabx ,其中x是自变量,yˆ是与x的量相对应的依变量y的点估计值;a叫8、直线回归方程通式为y回归系数,b叫回归截距。(×)
9、中数与样本内的每个值都有关,它的大小受到每个值的影响。(×)
10、若事件A与事件B同时发生某事件才发生,则称某事件为A与B的和事件。(×) 三、填空
1、次数分布表中各组的最大值与最小值称为( 组限),其中,数值小的称为( 下限 ),数值大的称为( 上限),每一组上限与下限的平均数称为该组的( 组中点值 )。
2、方差分析的三个基本假定是(效应的可加性 )、(分布的正态性)和( 方差的同质性 )。 3、对于样本2,3,3,4,有
4、已知SSx64,SSy9,SP16。则回归系数b=( 0.25 )。 5、直线相关分析中,相关系数r的取值区间是( [-1,1] )。 6、用来测验假设的概率标准称为( 显著水平 )。 7、4个处理加1个对照的拉丁方试验应重复( 5 )次。
8、相关系数r= 0.9382和r= - 0.9382表示变量X和Y相关的(密切程度 )是一致的。 9、某随机变量x~N(25,9),则μ=( 25 ),σ=( 3 )。
10、( 平均数)的种类主要有算术平均数、中数、(众数 )、几何平均数和调和平均数。 11、自由度的统计意义是指在计算(离均差平方和)时,能够自由变动的离均差的个数。 12、( 对照)是比较的基准,任何试验都不能缺少,否则就不能显示出试验的处理效果。
13、统计学上采用(回归分析)研究呈因果关系的相关变量间的关系;采用相关分析研究呈平行关系的相关变量间的关系。
(x3)2 ( < ) (x0)2。(填>、<或=)
实用文档
四、单项选择
1、比较两个小麦品种小区产量的分布特征时,适宜采用的统计图是( B ) A.方柱形图 B.多边形图 C.条形图 D.饼图 2、下列不能反映资料变异程度的统计数是( A )。
A. 平均数 B. 方差 C. 标准差 D. 变异系数 3、统计推断某参数在区间[L1,L2]内的置信度为99%,则其显著水平是( A )。
A. 0.01 B. 0.05 C. 0.90 D. 0.95
4、裂区设计中的主区处理是指( A )。
A. 精确度稍低的因素的各个水平 B. 精确度稍高的因素的各个水平
C. 水平数多的因素 D. 水平数少的因素
5、( C )在纵横两个方向都应用了局部控制,在试验结果的统计分析上要比随机区组多一项区组间变异。
A.完全随机设计 B.条区设计 C.拉丁方设计 D.裂区设计
6、完全随机试验设计是指每一供试单位都有同等机会接受所有可能处理的试验设计,没有( D ),但要求在尽可能一致的环境中进行试验。
A.重复 B.偶然误差 C.系统误差 D.局部控制 7、能够控制两个方向的土壤肥力差异的设计方法是( C )。
A.随机区组设计 B.完全随机设计 C.拉丁方设计 D.裂区设计
8、要对某一小麦品种的穗长(cm)和穗粒重(g)的整齐度作出比较,适宜采用的变异数是( D )。 A.极差 B.方差 C.标准差 D.变异系数
9、总体方差未知时且n30时,在95%置信度下的置信区间为( C )。 A.xu0.05x B.xu0.05sx C.xt0.05sx D.xt0.05x 10、样本容量为10的样本方差的自由度为( B )。 A.8 B.9 C.10 D.11 五、简答
1、什么是变异数,变异数在统计中有什么用途?
2反映资料离散性的特征数称为变异数。
变异数的用途:①表明资料中观察值的变异程度大小。 ②确定样本平均数的精确性、反映样本平均数代表性的优劣。
2、常用的变异数有哪些类型?
常用的变异数有极差、方差、标准差和变异系数。
实用文档
ˆabx中,回归系数b和回归截距a的意义是什么? 3、在线性回归方程yˆ平均地将要增加(b>0)或减少(b<0)的单位数;回归系数b是x每增加一个单位数时,yˆ值,即回归直线在y轴上的截距。 回归截距a是x=0时的y4、春季旬平均累积温度(x,旬·度)与一代三化螟盛发期(y,以5月10号为0)的回归方程为:
ˆ48.51.0996x,并有r0.8371**,试解释此结果。 y可以根据X的取值预测Y的变化。r0.8371**表明X与Y两变量存在极显著的线性回归关系,
ˆ48.51.0996x表明:(1)春季旬平均累积温度每增加1旬﹒度,一代三化螟盛发期平均y将提早1.0996天,所以早春气温越高,一代三化螟盛发期越早。(2)如果春季旬平均温度累积值为0,则预期一代三化螟的盛发期为48.5天,即5月10日再加48.5天,为6月27~28日。
六、综合
有一水稻品种的比较试验,供试品种有A、B、C、D、E、F 6个,其中 D 为对照品种,重复4次,采用随机区组试验设计,小区计产面积15m,其田间排列和小区产量(kg)如下图:
土壤肥力梯度方向 注意事项:1. 计算题的最终结果小数点后保留3位有效数值;2 多重比较结果用字母标记法;3. 可能用到的临界F值:F0.05(5,15)2
A 15.3 D 17.3 C 17.6 B 18.3 B 18.0 F 17.6 A 16.2 D 17.8 C 16.6 E 13.6 F 18.2 A 16.2 D 16.4 C 17.8 B 18.6 E 14.0 E 13.7 A 14.9 D 17.3 F 17.5 F 17.0 B 17.6 E 13.9 C 17.8 I
II
III
IV
1、 根据田间排列和小区产量(kg)图整理数据 2、 试对该资料作方差分析表
3、 如果方差分析品种间差异显著或极显著,请用SSR法对品种小区产量的平均数进行多重比较
2.90,F0.01(5,15)4.56;5. 多重比较时,可能用到的临界SSR值:
秩次距(
2 3.01
3 3.16
4 3.25
显著水平() 0.05
p)
5 3.31
6 3.36
实用文档
0.01
4.17
4.37
4.50
4.58
4.64
(1)数据整理
首先将试验结果整理成品种、区组两向表,并计算出各品种总和(Ti)、平均数(xi),各区组总和(Tj),列于下表。
水稻品种比较试验结果(kg/15m2)
区 组
品 种
I II III
IV
A B C
15.3 14.9 18.0 17.6 16.6 17.8
16.2 18.6 17.6 17.3 13.9 18.2
16.2 18.3 17.8 17.8 14.0 17.5
品种总和
Ti.
品种平均
xi.
62.60 72.50 69.80 68.80 55.20 70.30
15.65 18.13 17.45 17.20 13.80 17.58
D(CK) 16.4 17.3 E F 区组总和
T.j
13.7 13.6 17.0 17.6
97.0 98.8 101.8 101.6 T399.2
(2)平方和和自由度的计算
T2399.226640.027 矫正数 Crk46总平方和
SSTx2ijC15.3218.0217.526640.0276697.0806640.02757.053
总自由度 dfT=rk-1=4×6-1=23 区组平方和
97.0298.82101.82101.62SSrC6640.027k6 39856.24 6640.0272.6806T2j区组自由度 dfr=r-1=4-1=3
实用文档
处理平方和
62.6272.5270.32SStC6640.027r4 26769.62 6640.02752.3784iT2处理自由度 dft=k-1=6-1=5 误差平方和
SSeSSTSSrSSt57.0532.68052.3781.995
误差自由度 dfe=(r-1)(k-1)=(4-1)×(6-1)=15
(3)列出方差分析表,进行F检验
方差分析表
变异来源
区组3(1分) 2.680(1间
分)
0.893(1分) 10.476(1分) 0.133(1分)
78.767**(2分)
2.90 4.56
6.714(1分)
df
SS
MS
F
F0.05 F0.01
品种5(1分) 52.378(1间 误差
15(1分)
总变异
23(1分)
分) 1.995(1分) 57.053(1分)
F检验结果表明供试品种平均产量之间存在极显著差异。 2. 各品种平均小区产量的多重比较
平均数标准误Sx为Sx LSR值表
P 2 3 4 5 6 LSR0.05
MSer0.1330.182 4 0.575 0.592 0.602 0.612
实用文档 0.548 LSR0.01 0.759
各品种平均产量间的差异显著性(SSR法)
品 种 B F C D(CK) A E
平均产量(kg/15m2) 18.13 17.58 17.45 17.20 15.65 13.80
差异显著性
0.05(2分) 0.01(2分) a b b b c d
A AB AB B C D
0.795 0.819 0.834 0.844
多重比较结果表明,水稻品种B的产量最高,极显著高于品种D(CK)、A、E,显著高于品种F、C;品种F、C、D(CK)之间差异不显著,但均极显著地高于品种A、E;品种A、E之间差异不显著。
作业题六
一、名词解释
1、随机区组设计:将整个试验地划分成等于重复次数的若干个区组,再在每一区组中随机安
排全部处理的试验设计。
2、显著水平:显著水平(significance level)是统计假设测验中,用来测验假设正确与否的概率标准,一般选用5%或1%,记作。
3、统计数:是由样本内所有个体的观察值计算而得的样本特征数。
4、处理效应:试验处理对试验指标所起的增加或减少的作用称为处理效应。
5、生长竞争:是指当相邻小区种植不同品种或施用不同肥料时,由于株高、分蘖力等性状表现的不同,通常将有一行或更多的边行受到影响,即一方受到抑制,一方获得生长优势。
二、判断,请在括号内打√或×
1、随机区组设计遵循试验设计原则的重复、随机排列和局部控制三项原则。(√) 2、试验设计三项原则,其中重复和随机排列的作用是有效地降低试验误差。(×) 3、变异系数能用来直接比较两个单位不同或平均数相距较远的样本。(√)
实用文档
4、在边际效应明显的试验中,方形小区是有利的。(√)
5、设一样本有7个观察值,6、10、9、6、12、7、13,则方差为2.828。(×)
6、单因素完全随机试验设计进行方差分析,总变异可以分解为处理间变异、区组间变异和误差三项。(×) 7、标准差与样本内的每个值都有关,它的大小受到每个值的影响。(√)
ˆabx ,其中x是自变量,yˆ是与x的量相对应的依变量y的点估计值;a叫8、直线回归方程通式为y回归截距,b叫回归系数。(√)
9、有严重斑块差异的地块适合用作试验地。(×)
10、若事件A与事件B同时发生某事件才发生,则称某事件为A与B的和事件。(×) 三、填空
1、有一氮(N)、磷(P)肥的2×2试验,现假设获得以下三组资料,试分别判断三组资料互作的性质,填于空①、②和③位置处。
因素 N1 N2 10 16 14 14 N1 N2 10 16 14 20 P1 P2 P1 P2 因素 N1 N2 10 16 14 24 P1 P2 ①(为负互作) ②(为无互作) ③(为正互作) 2、根据研究目的拟定的进行比较的一组处理,在相同试验条件下试验,所得各处理平均数值与试验总平均数值之差,称为(处理效应)。
3、有一品种和肥料量的二因素试验,每一处理重复3次,得各处理平均产量(kg/667m)如下表,试求品种的主效为(70 kg/667m);肥量的主效为(225 kg/667m);互作效应值等于(10 kg/667 m),品种与肥量互作为( 正)互作。
处理 不施肥 施肥
常规品种 505 720
新品种 565 800
2
2
2
2
4、随机抽取20株小麦,其株高(cm)分别为82,79,85,84,86,84,83,82,83,83,84,81,80,8l,82,81,82,82,82,80,则小麦的平均株高为(x34.67),标准差为( s=3.33)。 5、统计推断包括(假设检验 )和(参数估计)两个方面。
12(OE)2iik(OE)k222222 6、次数资料的测验中,=( ),当自由度为1时,c= )。 (C1i1EEi7、若无效假设为H0:12,那么备择假设为(HA:12)。
8、将两尾t值表变为一尾t值表的方法是将其概率值( 除以2 )。
9、在参数区间估计中,保证参数在某一区间内的概率1称为(置信概率)。
10、t检验法是检验( 2 )个平均数之间的差异,而( 方差分析)是对3个以上平均数间的差异进行
实用文档
显著性检验。
11、测验若干个处理平均数间的差异显著性的多重比较一般用(SSR ),测验若干个处理平均数与某一“对照”平均数的差异显著性的多重比较一般用( DLSD )。
四、单项选择
1、算术平均数的离均差平方的总和为( B )。 A.最大 B.最小 C.1 D.0
2、资料中最大观察值与最小观察值的差数称为( B )。 A.标准差 B.极差 C.方差 D.相差
3、方差分析的基本假定中除可加性、正态性外,还有( C )假定。 A.无偏性 B.代表性 C.同质性 D.重演性 4、对于大样本平均数的假设测验,可使用( A )。
A.u测验 B.t测验 C.测验 D.F测验
5、一玉米试验,设有A1、A2、A3、A4 4个品种,B1、B2、B3 3种密度,分两期播种,该试验的试验因素为( D )。 A.品种、密度 B.品种、播种期 C.密度、播种期 D.品种、密度、播种期 6、下列4种试验设计中,可以将区组分散设置在不同地段的是( A )。 A.随机区组设计 B.拉丁方设计 C.完全随机设计 D.裂区设计 7、反映资料离散性的特征数是( C )。
A.参数 B.平均数 C.变异数 D.代表数
8、根据遗传学原理,豌豆的红花纯合基因型和白花纯合基因型杂交后,在F2代红花植株出现的概率为0.75,白花植株出现的概率为0.25。若每次观察5株,得3株红花2株白花的概率为( C )。 A.3×0.75×0.25
3
2
2
B.5×0.75×0.25
32
C.10×0.75×0.25
32
D.10×0.75×0.25
23
9、一小麦施肥的盆栽试验,设有8个处理,每处理种植4盆,采用完全随机设计。则在方差分析时该试验的变异来源为( A )。
A.处理间变异,处理内盆间变异 B.处理间变异,处理内盆间变异,组间变异 C.处理间变异,处理内盆间变异,总变异 D.处理内盆间变异,组间变异,总变异 10、下列相关系数中表示两变量间关系最密切的是( A )。
A.r= −0.8999 B.r=0.8478 C.r=0.8665 D.r= −0.8805 五、简答
1、为什么顺序排列试验结果采用百分比法进行统计分析?
由于这类试验设计仅遵循了试验设计的局部控制和重复二大基本原则,没有遵循随机原则,因此不能正确地估计出无偏的试验误差。试验资料难以进行统计假设检验和统计推断,不宜用方差分析方法进行统计分析。一般采用百分比法进行统计分析。
2、简述方差分析的基本步骤
(1)自由度和平方和的分解
实用文档
(2)F检验 (3)多重比较
4、 简述方差分析的基本假定
(1)效应的“可加性”
(2)误差的“正态性” (3)误差方差的“同质性”
5,决定系数和相关系数的区别是什么?
决定系数和相关系数的区别在于:首先,除| r | = 1和0的情况外,r2总是小于 | r |,这可以防止对相关系数所表示的相关程度作夸张的解释。其次,r可正可负,而r2则一律取正值。所以,r2一般不表示相关性质,只表示相关程度。
六、计算
1、为测定A、B两种病毒对烟草的致病力,取8株烟草,每一株皆半叶接种A病毒,另半叶接种B病毒,以叶面出现枯斑数的多少作为致病力强弱的指标,得结果于下表,试测验两种病毒致病力的差异显著性。(t0.05,72.365,t0.01,73.499) 株号 病毒A 病毒B
1 9 10
2 17 11
3 31 18
4 18 14
5 7 6
6 8 7
7 20 17
8 10 5
该资料属成对数据,因两种病毒致病力的差异并未明确,故用两尾检验。 d1= -1 d2=6 d3=13 d4=4 d5=1 d6=1 d7=3 d8=5 H0:d0, HA:d≠0
0.05
324
n8(d)23222222 SSdd(1)65130.0327
22nd)8d(130.03271.52 Sdn(n1)87d4 t2.632
Sd1.52 ∵|t|>t0.05 , ∴否定H0
dd 推断:两种病毒的致病力差异显著。
2、一小麦品种比较试验,参试品种5个,采用随机区组设计,重复3次。由该试验结果算得下表中的部分平方和。试完成表中剩余项目的计算,并作F测验(计算结果填入表内,测验结果用 “*” 号表示。保留二位小数)。 变异来源 区组间 品种间 DF ( ) ( ) SS 0.68 87.04 MS ( ) ( ) F ( ) ( ) F0.05 3.84 F0.01 7.01 实用文档 误差 总变异
( ) ( )
( ) 93.05
( )
变异
DF
来源
SS
MS
F
F0.05
0.01
F
区组
(2)
间
0.68
(0.34)
(0
.51)
7
品种
(4)
间
87.04
(21.76)
(3
3.84
2.48)
1
**
.0
误差 总变
(8) (5.33) (0.67)
(14)
异
93.05
3、许多害虫的发生都和气象条件有一定关系。某地测定1964~1973年间7月下旬的温雨系数(x,雨量mm/平均温度℃)和大豆第二代造桥虫发生量(y,每百株大豆上的虫数)的关系,已经算得一级数据如下,试计算二级数据。
x49.76 x394.4644 y1090 y153348 xy3351.64 n10
22(49.76)2146.8586 答:SSx394.464410(1090)234538 SSy1533481049.761090 SP3351.642072.2
10 x4.976
y109
4、利用3题数据建立y依x变化的线性回归方程并解释回归方程的意义。
b2072.214.11
146.8586a109(14.114.976)179.21
ˆ179.2114.11x y温雨系数x的值越小越有利于二代造桥虫的发生,即7月下旬高温低湿的气象条件有利
实用文档
于二代造桥虫的发生。
作业题七
一、名词解释
1、总体:由统计研究的目的而确定的同类事物或现象的全体。
2、唯一差异原则:在进行处理间比较时,除要比较的差异外,其它条件应当完全一致。 3、统计数:由样本的全部观察值估算的、描述样本的特征数。 4、互作:在多因素试验中,因素内简单效应间的平均差异。
5、水平:试验因素通常是可以人为控制的,其数量的不同等级或质量的不同状态称为水平。
二、判断,请在括号内打√或×
1、偶然误差又称为随机误差,是由试验中一些未知或无法控制的因素所引起。(√) 2、变异系数的计算公式为,CV(%) =
x×100(%)。(×) s3、算术平均数的重要特性之一是离均差之和为最小。 (×) 4、当u = 1.96时,统计假设检验的右尾概率为0.01。 (×)
5、一个试验资料的方差分析数学模型的确定,是在获取试验结果之前就已确定。(√) 6、回归模型双变量资料中,当x取某一定值时,只有唯一确定的y值与之相对应。(√) 7、 正态分布总体N(5,16)的平均数是5,标准差是16。(×) 8、在单因素试验中,每一个水平就是一个处理。(√)
9、系统误差影响数据的准确性,而偶然误差影响数据的精确性。(√) 10、用样本的全体观察值计算的、描述样本的特征数称为参数。(×) 三、填空
1、平均数的种类主要有(算术平均数)、(中数)、(众数)、(几何平均数)和调和平均数。 2、描述一组资料中各观察值(变异程度)的统计数主要有极差、标准差和变异系数。 3、(对照)是比较的基准,任何试验都不能缺少,否则就不能显示出试验的处理效果。 4、在成对数据的比较中,t值具有的自由度为(n-1)。 5、k (k≥3)个样本平均数的假设测验用(方差分析)。
6、相关系数可表明两个变量相关的(性质),决定系数可表明两个变量相关的(密切程度)。 7、田间试验中引起误差的最主要且难以控制的外界因素是(土壤差异)。
8、5个处理4次重复的完全随机设计的统计分析,其处理自由度为( 4 ),误差自由度为( 15 )。
实用文档
9、在边际效应明显的试验中,适合的小区形状为( 方 )形。 10、某样本观察值为12,14,15,15,16,17,18,15,则该样本的算术平均数为( 15.25 ),中数为 ( 15 ),众数为(15 )。
11、某水稻品种株高的观察值为13,15,16,16,17,17,19,16,则该样本的标准差s =(1.73),样本均数标准差sx=(0.61),该水稻株高的总体平均数的置信度为95%的置信区间为([ 14.68,17.57])。
四、单项选择
1、有一甜玉米品种比较试验,顺序排列。要判断某品种的生产力确优于对照,其相对生产力一般至少应超过对照( D )以上。
A.1% B. 5% C. 15 % D. 10%
2、( B )试验设计是指每一供试单位都有同等机会(等概率)接受所有可能处理的试验设计,但要求在尽可能一致的环境中进行试验。
A.拉丁方 B. 完全随机 C. 随机区组 D.裂区
3、 选面积为40m的马铃薯小区10个,各分成两半,一半去花另一半不去花,若要检验两处理块茎产量的差异显著性,应采用( C )的处理方法进行比较。
A. 成组数据 B. 卡平方检验 C.成对数据 D. u检验 4、以下四种试验设计中只可用于多因素试验的设计是( C )。
A. 间比法设计 B. 随机区组设计 C. 裂区设计 D.拉丁方设计 5、( D )是度量实际观察次数与理论次数偏离程度的一个统计数。
A. F B. t C. u D.
6、检验时,当df≥2时,不需矫正,但要求各组内理论次数不小于( D )。
A.10 B. 2 C. 1 D.5 7、( B )是描述两个相关变量x与y线性相关程度和性质的统计数。
A. 决定系数 B. 相关系数 C. 回归系数 D. 回归截距 8、样本容量为n的样本方差的自由度为( B )。
A.n B.n1 C.n2 D.2n1
2
2
2
ˆabx中,当a0时,表示( C )。 9、在线性回归方程yA.回归直线在x轴上方交于y轴 B.回归直线在x轴下方交于y轴 C.回归直线通过原点 D.变量X与Y之间不存在线性回归关系 10、方差分析的基本假定中除可加性、正态性外,还有( C )假定 A.无偏性 B.代表性 C.同质性 D.重演性
实用文档
五、简答
1、简述田间试验误差的来源
(1)试验材料固有的差异
(2)试验过程中操作质量不一致所引起的差异 (3)进行试验的外界条件的差异
2、简述控制田间试验误差的途径
(1)选择同质、一致的试验材料
(2)改进试验操作和管理技术,使之标准化 (3)控制引起差异的外界主要因素
3、列举3个描述样本资料变异程度的统计数
常用的描述一个样本变异程度的统计数有:极差、方差、标准差和变异系数。
4、 写出3个变异数的数学表达式
(1)方差 S2xi1nix2n1 (2)标准差 sxxn12
(3)变异系数 CVs100% x5、 何谓重复?在试验中为什么要设置重复?
重复是指试验中将同一试验处理设置在两个或两个以上的试验单元上,即同一试验处理所设置的试验单元数称为重复数。
因为试验误差是客观存在的,但只能由同一试验处理的几个重复间的差异估计,即重复具有估计试验误差作用。其次,数理统计学已证明,样本平均数的标准误Sx与样本观察值的标准差S和样本容量n之间的关系为:SxS/n,即平均数抽样误差的大小与重复次数的平方根成反比。适当增加重复次数可以降低试验误差,提高试验的精确度。另外,重复、随机排列和局部控制是田间试验设计中必须遵循的三个原则。采用这三个基本原则进行田间试验设计,配合适当的统计分析方法,既能准确地估计试验处理效应,又能获得试验误差估计,因而对于所要进行的各处理间的比较作出可靠的结论。因此,在试验中要设置重复。
6、 何谓“小概率事件的实际不可能性原理”?在农业试验中常用的两个小概率标准是多少?
小概率事件实际上不可能性原理:概率很小的事件,在一次试验中几乎不可能发生或可认为不可能发生。
农业试验中常用的两个小概率标准是0.05(5%)水平和0.01(1%)水平。
实用文档
六、计算
1、紫花大豆和白花大豆杂交,F2代花色分离理论比例为3:1,在F2代出现如下表所示的分离株数,请补充表中数据。
大豆杂交F2代花色分离数据表
O-E –O-E–
花色 实际株数(O) 理论株数(E) O-E 2
1/2 1/2)/E 紫花
白花 总和
208 81 289
( ) ( )
( ) ( ) 0
8.25 8.25 /
0.314 0.942 1.256
花色 紫花 白花 总和
实际株数(O) 208 81 289
理论株数(E) (216.75) (72.25)
O-E (–
8.75) (+8.75) 0
O-E –1/2 8.25 8.25 /
O-E–1/2)2/E 0.314 0.942 1.256
2
2、问上题(1题)资料的实际观察比例是否符合3:1的理论比例?(0.05(1)=3.84)。
2检验
1)提出假设Ho:大豆花色F2代符合3:1的理论比例;HA:大豆花色F2代不符合3:1的理论比例。
2)显著水平=0.05
3)计算统计数:2c =(O-E–1/2)2/E=1.2560
4)因2c20.05(1),故应接受Ho,说明大豆花色这对性状是符合3:1比率,即符合一对等位基因的表型分离比例。
3、假设某一试验资料结果分析已经计算出了多重比较的最小极显著极差值—LSR表,试用标记字母法将多重比较的结果表示出来。
P 2 3 4 5
LSR0.05 3.90 4.10 4.22 4.29
LSR0.01 5.41 5.67 5.84 5.94
该资料各处理平均数的差异显著性
差异显著性检验表
实用文档
答:
处理 平均数 差异显著性 0.05
0.01
D C A B E
131.5 128.5 127.0 124.5 120.0
( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )
处理 平均数
差异显著性 0.05
0.01
D 131.5 (a) (A) 128.5 (ab) (AB) 127.0 (b) (AB) 124.5 (b) (BC) 120.0 (c)
(C)
作业题八
一、名词解释
C A B E
1、置信区间:在一定概率保证下,估计出总体参数所在的范围或区间,这个范围或区间叫置信区间。
2、重复:是指在一个试验中同一处理设置两个以上的试验单位。 3、试验指标:试验中用来衡量试验效果的量或指示性状。 4、统计数:由样本全部观察值而算得的特征数。
5、随机事件:随机试验的每一个可能结果称为基本事件或简单事件,若干个基本事件组合而成的事件称作复合事件或复杂事件。基本事件和复合事件统称为随机事件。
二、判断,请在括号内打√或×
1、重复在试验设计中的作用在于降低试验误差和估计试验误差。(√) 2、试验设计只是获得统计资料的一个途径,可以不考虑其合理性。 (×)
3、在统计学上常常用极差(或范围)度量样本中每个数与平均数之间的关系。(√)
4、计算某小麦品种A和B株高的平均数和标准差分别为A=120±5.0,B=78±4.0,故可知 A比B整齐。
(×)
5、决定系数(r)既可表示相关的程度,又可表示相关的性质。(×)
6、若检验几种处理间的效应,则其F值求算公式为:F=处理内的均方/试验误差均方。(×) 7、方差分析中,若F<1,则不必查F表,即可确定P>0.05,应接受H0。(√)
8、4个豌豆品种比较试验的产量结果分析时,若无效假设H0:μ1=μ2=μ3=μ4,则对应的备择假设HA:μ1
2实用文档
≠μ2≠μ3≠μ4。(×)
9、概率为0的事件为不可能事件。(×)
10、样本方差或标准差随样本容量的增大而减小。(×) 三、填空
1、在(单因素)试验中处理数与因素的水平数相等。
2、若无效假设为H0:12,那么备择假设为(HA:12)。 3、土壤差异的表现形式通常有(趋向式)和(斑块式)两种。 4、试验中同一性状的重复观察值彼此接近的程度,称为(精确度)。
5、大样本平均数的假设测验用(u )测验,小样本平均数的假设测验用( t )测验。 6、由统计数组成的分布称为(抽样分布)。 7、只有一个否定区域的假设测验称为(一尾检验)。
8、比较实际观察次数与理论次数是否相符的假设测验方法称为(适合性检验)。
29、有一双变数资料,已求得ssy=65,sp94,n=6,则该资料的r=(0.9925),r=x=138,ss(0.9851)。
10、由金皇后玉米13株的株高与穗位高数据,算得相关系数r=0.8978(r0.01,11=0.684),则表明株高与穗位高呈(正)相关,它们的变异有(80.6%)可用线性关系互相说明。
11、方差分析有3个基本假定:一是处理效应与环境效应等应该具有(可加性 );二是试验误差ij应该是随机的、彼此独立的,作正态分布,即(正态性);三是所有试验处理必须具有共同的误差方差,即(同质性)。
212、用于测验观察的实际次数与某种理论次数是否相符合,称为(适合性测验)。根据次数资料判断
2独立性测验)。测验多个样本所来自的总体的方差
两类因素彼此相关或相互独立的假设测验,即为(
2是否相等的统计分析方法,称(方差同质性测验)。
四、单项选择
1、对于小样本二项资料百分数的假设测验,可使用( B )。 A.u测验 B.连续性矫正u测验 C.测验 D.F测验
2、A因素有4个水平 ,B因素有2个水平, 实验重复3次, 若采用完全随机实验设计,全部实验共有(
B)。
B. 24个处理 C. 12个处理
D. 9个处理
2
A. 8个处理
3、在一定范围内,随着小区面积的增加,试验误差的变化趋势是( B )。 A.增加 B.降低 C.不变 D.没有规律
4、有一品种和灌水量的试验,有A、B、C、D、E 5个品种,有多、中、少3种灌水量,最适宜采用的设计方法是( D )。
实用文档
A.随机区组设计 B.完全随机设计 C.拉丁方设计 D.裂区设计
5、在随机区组设计中,各区组的延长方向及区组内各小区的延长方向与土壤肥力梯度的方向要分别( C )。
A.平行,平行 B.垂直,垂直 C.垂直,平行 D.平行,垂直 6、田间试验设计中,应用局部控制原则的作用是( D )。
A.估计试验误差 B.排除系统误差 C.消灭试验误差 D.降低试验误差 7、保证参数位于置信区间内的概率称为( B )。
A.显著水平 B.置信度 C.临界值 D.置信限
8、在一定的概率保证下,由样本结果估计相应总体参数的可能范围的统计方法称为( C )。
A.假设测验 B.点估计 C.区间估计 D.效应估计 9、方差分析中的“可加性”假定是( A )的保证 。 A.正确分解总变异的平方和和自由度 B.作出正确计算
C.作出正确的F测验 D.正确估计误差方差
ˆabx中,b叫做回归系数,表示( D )。 10、在线性回归方程y A.回归直线在y轴上的截距
B.x每增加一个单位时,y平均增加的单位数 C.x每增加一个单位时,y平均减少的单位数 D.x每增加一个单位时,y平均增加或减少的单位数 五、简答
1、什么是对照,在品种比较试验中如何选择对照?
对照是试验方案中设置的标准处理,用于衡量处理或品种的好坏,是比较试验结果的标准。在品种比较试验中应选用上级种子管理部门所规定的标准品种作为对照。
2、参数的区间估计与假设测验的显著性之间是什么关系?
参数的区间估计可提供假设检验的信息,因为置信区间是一定置信度下包含有总体参数的范围,所以,若在一定置信度下的置信区间内包含有假设的参数,则无效假设被接受;若在一定置信度下的置信区间内没有包含假设的参数,则无效假设被否定。具体讲,若在一定置信度下置信区间内不包含零值,即两个置信限同号(同为正号或同为异号),则否定无效假设,接受备择假设;若在一定置信度下置信区间内包含有零值,即两个置信限异号,则接受无效假设,否定备择假设。
3、 简述方差分析的基本思路。
实用文档
方差分析是将k(k ≥3)个样本的观察值作为一个整体加以考虑,首先计算出整体的总变异自由度和平方和,将总变异的自由度和平方和分解为各个变异来源的相应部分,计算出各变异来源的均方值,从而获得不同变异来源总体方差的估计值,并以方差作为衡量各因素作用大小的标准,计算这些均方的适当的F值,通过F检验揭示各个因素在总变异中的重要程度,就能检验假设H0:12k,对各处理总体平均数的差异显著性做出统计推断。
4.连续性变异资料建立次数分布表的步骤
1)求极差;
(2)确定组数和组距;
(3)确定组限和组中点值;
(4)观察值入组,统计各组次数,作出次数分布表。
六、计算
1、在某地区进行马铃薯播种期试验,从3月20日开始每隔半月播种一次,共播4次,采用随机区组设计,重复4次。方差分析时已算得部分变异来源的平方和列入下表。试完成表中剩余项目的计算,并作F测验(测验结果用 “*” 号表示,保留两位小数); 变异来源 区组间 处理间 误差 总变异
DF ( ) ( ) ( ) ( )
SS 109.55 148.69 ( ) 280.76
MS ( ) ( ) ( )
F ( ) ( )
F0.05 3.86 3.86
F0.01 6.99 6.99
变异来源 区组间 处理间 误差 总变异
DF (3) (3)
SS 109.55 148.69
MS F F0.05 F0.01 6.99 6.99
(36.52) (14. 61**) 3.86 (49.56) (19.82**)
3.86
(9) (22.52) (2.50) (15)
280.76
2、1题处理间是否需要作多重比较?说明理由
处理间F检验显著,表明不同播种期的产量存在差异,为了明确其具体的差异显著性,需要作多重比较。
3、有一观察对数n = 11的双变数资料, 已求得SP=48, SSx=40, SSy=90, x=10, y=14, 计算该资
实用文档
料的直线回归并对其方程进行显著性检验 。(r0.05,90.602)
bSP481.2, SSx40aybx141.2102,
ˆ21.2x (1分) yrSPSSxSSy4840900.8
r0.8r0.050.602,所以直线方程真实存在。
作业题九
一、名词解释
1、区间估计:在一定置信概率下,估计出总体参数所在范围或区间的方法就叫区间估计。 2、随机排列:是指试验中每一处理都有相等机会实施并安排在任何一个试验单位上。
3、间比法设计:每两个对照之间都均匀、等数目的安排3个或3个以上处理,各重复区的第一个和最后一个小区一定是对照。
4、完全随机设计:每一个供试处理完全随机地分配给不同的试验单元的试验设计。 5、积事件:若干个事件都发生某事件才发生,则称某事件为这若干个事件的积事件。
二、判断,请在括号内打√或×
1、在统计学上常常用极差(或范围)度量样本中每个数与平均数之间的关系。(×) 2、随机区组设计的精确度高于拉丁方设计的精确度。(×)
3、计算某小麦品种A和B株高的平均数和标准差分别为A=120±5.0,B=78±4.0,故可知 A比B整齐。
(×)
4、某一事件概率的大小是由频率决定的。(×)
5、正态分布是随着自由度的不同而表现出一组对称分布。(×)
6、显著性检验是根据小概率实际不可能性原理建立起来的检验方法。(√) 7、多个平均数间差异分析可以采用单因素方差分析。(√)
8、对A因素有3个水平,B因素有4个水平交叉分组资料方差分析时,若A因素F测验达显著,则A因素必需要作均数间多重比较。(√)
9、方差是资料中最大观察值与最小观察值的差数。(×)
10、一个良好的实验设计必须遵循重复、随机和局部控制三个基本原则。设置重复、处理随机排列可以降低实验误差,局部控制可以无偏估计实验误差。(×) 三、填空
1、随机区组试验设计遵循的原则为(重复)、(随机排列)、(局部控制)。
2、用一定的概率保证来给出总体参数所在区间的分析方法称为(区间估计),保证概率称为(置信度)。
实用文档
3、二项资料百分数的假设测验一般用( u )测验,但小样本需进行(连续性矫正)矫正。
4、若t0.05tt0.01,那么无效假设正确的概率为(0.01~0.05),而备择假设正确的概率为(0.95~
0.99 )。
5、有一玉米品种和肥料量的2 2试验,每一处理重复3次,得各处理平均产量(kg/ha)列入下表,试求品种的主效为(2587.5kg/ha);肥量的主效为(1912.5kg/ha);品种与肥量互作为( 正 )互作,互作效应值等于(225kg/ha)。
施肥量
品种 常规品种
不施肥
00
施肥
00
78
500 60
75
10新品种
84
6、5个处理4次重复的完全随机设计的统计分析,其误差自由度为(15 )。
7、试验方案中的各处理间应遵循( 唯一差异)原则才能正确地进行处理效应的比较。
yy)占y总平8、相关系数的平方称为(决定系数),它反映了由x不同而引起的y的平方和U(ˆ方和SSy2(yˆy)的比例。
29、比较实际观察次数与理论次数(是否相符)的假设测验方法称为适合性测验。 10、样本标准差s s= (xx)n12,样本均数标准差sxs=x(s1.7244 0.5453)。n1011、试验中观察所得的数据因性状、特性不同,一般为( 数量性状 )资料和(质量性状)资料两大类。
四、单项选择
1、对于两个样本方差的假设测验,可使用( D )。 A.u测验 B.t测验 C.测验 D.F测验 2、 根据如下两个小麦品种的主茎高度的测量结果,可以判断( B ) 品种 甲 乙
算术平均数(cm)
95.0 75.0
标准差(cm)
9.02 9.02
变异系数 9.5 12.03
极差(cm) 15.3 9.8
2
A. 甲品种比乙品种变异大。 B. 甲品种比乙品种变异小。
C. 因为他们的算数平均数不相等,无法判断那个品种变异大。 D. 根据表中,S甲=S乙,甲品种与乙品种变异大小相等。
3、有n个观察值的资料,制成频率分布图,该资料频率分布图的总面积必等于( D )。
A. n B. n/f C. f/n D. 1
实用文档
( 注:f 为每分组中出现的观察值次数)
4、A因素有3个水平 ,B因素有4个水平, 实验重复3次, 若采用完全随机实验设计,全部实验共有(B)。 A. 12个处理
B. 36个处理 C. 10个处理 D. 7个处理
5、已知样本离均差平方和为360,样本容量为10,标准差( A )。 A. 6.3 B. 6 C. 36 D. 9 6、当FF0.05(1,2)意味着( C )。
A. H0错误的 B. H0错误的概率小于0.05
C. H0正确的概率小于0.05 D. H0正确时,观察到现在的差异或更大差异的概率小于0.05 7、在两个样本平均数比较的t检验中,无效假设是(D )。
A.两个样本平均数不等 B.两个样本平均数相等 C.两个总体平均数不等 D.两个总体平均数相等 8、在t 检验中,P< 0.05统计上可以认为 (C )。
A. 两个样本平均数不等 B. 两个样本平均数相等 C. 两个总体平均数不等 D. 两个总体平均数相等
9、下列统计数不属于平均数的是( C )
A.中数 B.众数 C.变异系数 D.几何平均数 10、总体平均数95%置信区间表示为(C )。
A. x1.96s
B. xt0.01,sx D. x1.96
C. xt0.05,sx 五、简答
1、什么叫回归分析?直线回归方程中的回归截距、回归系数的统计意义是什么?
回归分析是研究变量之间联系形式的统计方法。该联系形式用回归方程表示,并将此回归方程用于对依变量作预测估计。回归分析按自变量个数可分为一元回归和多元回归;按方程的次数又可分为线性回归和非线性回归。一元线性回归(直线回归)是一种用直
ˆabx来揭示两线性相关变量的关系的回归分析。 线方程yˆ,即回归直线在在直线回归方程中,回归截距a是自变量x=0时依变量的回归估计值yy轴上的截距。它在专业上是否有实际意义,取决于两点:①所研究的自变量能否取0值。若不能取0值,则不具有专业意义。例如,在某小麦每667㎡基本苗数x与对应的有效穗数y两相关变量的回归分析中,x不可能取0值,故a无实际意义。②建立方程的自变
实用文档
量数据中是否含有0值,或者自变量最小值xmin是否接近0值。若建立方程的自变量数据
ˆabx的变化规律还有待实践中没有包含有0值,或xmin远离0值,则a是否符合方程y检验,故不能确定其专业意义。回归系数b是回归直线的斜率,其统计意义是自变量改变一个单位,而引起依变量平均改变的单位数。其符号反映了两变量的相关性质,b>0时,两变量为正相关,即同向改变;b<0时,两变量为负相关,即反向变化。
2、什么叫相关分析?相关系数和决定系数各具有什么意义?
相关分析是研究两相关变量联系程度和联系性质的统计方法。回答两变量是否有关,关系密切与否,且是正相关,还是负相关的问题。这些问题都由计算的相关系数r来回答。 相关系数的符号表示变量的相关性质,r>0时,表明两变量呈正相关,即一个变量增加(或减少),另一变量随之增加(或减少);r<0时,为负相关,即一个变量增加(或减少),另一变量受其影响反而减少(或增加)。相关系数的绝对值揭示两变量的联系程度,|r|愈接近于0,说明两变量关系愈不密切;|r|愈接近于1,说明两变量关系愈密切。
相关系数的平方是决定系数r2,它表示在两变量各自的总变异中由它们之间的线性关系而引起的变异部分所占比例。也可用来反映两变量的联系程度,r2愈接近于1,表示关系愈密切;r愈接近于0,关系就愈不密切。在表示两变量的联系程度上,决定系数比相关系数有更确切的含义。
3、 F检验应具备什么条件?
2
① 对试验所考察性状有影响的各变异来源的效应(如环境效应)应具有“可加性”(additivity);②试验误差ij应该是随机的、彼此独立的,具有平均数为零且作正态分布,即“正态性”(normality);③ 所有试验处理必须具有共同的误差方差,即误差方差的“同质性”(homogeneity)。
4、 什么是小概率事件不可能性原理?它有什么用途?
一次随机试验概率很小的事件被当作不可能事件处理,称作小概率事件不可能性原理,一般认为概率小于0.05或小于0.01的事件为小概率事件。(3分)小概率事件原理用于统计假设检验中的推断或决策过程,是统计分析的推断规则或决策准则,是统计学的核心逻辑。
六、综合
使用某激素进行大豆浸种试验, 设有5种浓度(A 1、A 2 、A 3 、A 4、A 5及3 种 处理时间(T 1、T
实用文档
2
、T 3,单位:分钟)处理后播种,出苗后20天,每处理随机抽取1株测定干物质重量(克)。试根据该
资料回答以下问题: 1、完成该资料的方差分析表 变异来源 浓度间 时间间 误 差 总变异
DF ( ) ( ) ( ) ( )
SS 289.06 ( ) 4.94 295.73
MS ( ) ( ) ( )
F ( ) ( )
F 0.05 3.69 19.30
变 异 来 源 浓 度 间 时 间 间 误 差 总变异
DF (4)
SS
MS F F 0.05
(117.02*) 3.69 289.06 (72.265)
(2) (1.73) (0.865) (1.4) 19.30 (8)
4.94
(0.6175)
(14) 295.73
2、上述方差分析说明什么问题?
不同浓度间检验差异显著,时间间差异不显著。
3、 若欲对浓度间干物质重平均数采用SSR法作多重比较,计算所用平均数标准误值。
平 均 数 标 准 误 值 为0.454。
4、根据下列的LSR0.05值表,试用SSR法对浓度间干物质平均重比较,用字母标记法完成其5%差异显著性比较表
P LSR0.05
处理 A1 A2 A3 A4 A5
2 1.479
3 1.543
4 1.579
5 1.597
平均数x 13.67 12.33 11.00 10.85 9.43
5% 差 异 显 著 性
( ) ( ) ( ) ( ) ( )
实用文档 处 理 平 均 数x 5% 差 异 显 著 性(5分)
A1 A2 A3 A4 A5
13.67 12.33 11.00 10.85 9.43
a ab b bc c
作业题十
一、名词解释
1、局部控制:就是分范围、分地段地控制非试验因素(试验条件),使各处理所受的影响趋于最大程度的一致。
2、对比法设计:每一处理的一侧(左侧或右侧)都设置一个作为对照的设计。
3、对立事件:对于两事件A与B,若一个发生则另一个就不发生,则A与B互为对立事件,两事件的发生非此即彼。
4、二项资料百分数:由二项次数转换成的百分数,其总体服从二项分布,故称为二项资料百分数。
5、复合事件:由若干个基本事件组合而成的事件,称复合事件。
二、判断,请在括号内打√或×
1. 标准差能用来直接比较两个单位不同或平均数相距较远的样本。(×) 2.任意样本的离均差的算术平均数应当等于零。(√)
3.从株高变化在100厘米至120厘米某小麦品种群体中准确地测得某一株的标准高度为105厘米的概率等于零。(√)
4.单因素完全随机试验设计进行方差分析,总变异可以分解为处理间变异、区组间变异和误差三项。(×) 5.显著水平是接受零假设(或无效假设)所使用的概率。(×)
(|OiEi|0.5)26.次数资料的 检验,当df >1时,χ公式为。(×)
Ei2
2
2c7.对于即可作相关又可作回归分析的同一组数据,计算出的b与r正负号是一致的。(√)
8.一个试验在安排区组时,原则上应尽可能保持区组内的最大一致性,区组间允许较大差异。(√) 9.试验设计三项原则,其中重复和随机排列的作用是有效地降低试验误差。(×) 10.采用成对数据分析还是成组数据分析是由试验方案所决定的。(√) 三、填空
1.田间试验中引起误差的最主要且难以控制的外界因素是(土壤差异)。 2.随机排列在田间试验设计中的作用是(无偏估计试验误差)。
实用文档
3.反映资料集中性的特征数称为( 平均数 )。
4.5个处理4次重复的完全随机设计的统计分析,其误差自由度为( 15 )。 5.一个样本中包含的个体数目称为(样本容量)。 6.统计假设测验中直接测验的是(无效)假设。 7.具有两个否定区域的假设测验称为( 两尾检验 )。
8. 某样本观察值为13,8,9,9,13,15,12,13,7,则该样本的算术平均数为 ( 11 ),中数为 ( 12 ),众数为( 13 )。
9.如果两个样本相关系数r1和r2的绝对值相等但符号相反,则表明这两个样本资料的关系是(相关程度
相同、相关性质不同 )。
10. 对单因素随机区组试验设计进行方差分析,总变异可以分解为(区组间)、(处理间)和(误差)三项。
11. 研究栽培密度和纯氮施用量对糯玉米产量的影响。栽培密度(株/666.7m)2个水平分别为A1:3500,A2:4000;纯氮施用量(kg/666.7m)2个水平分别为B1:20,B2:16,。这个试验方案包含( 2 )个因素,如果设计成一完全试验方案,4个处理组合分别为( A1 B1 )、( A1B2)、(A2B1)、(A2B2)。 12、(备择)假设与无效假设成对立关系。
四、单项选择
1、对于小样本平均数的假设测验,可使用( B )。
A.u测验 B.t测验 C.测验 D.F测验 2、两个平均数相比较的假设测验用( D )。
A.u测验 B.t测验 C.F测验 D.u测验或t测验 3、样本容量是组成样本的个体的数目,样本容量( A )为大样本。 A. n≥30 B. n ≤ 30 C. n>30 D. n<30 4、下列统计数不属于变异数的是( B ) A.极差 B.众数 C.变异系数 D.标准差
5、比较富士苹果的单果重量(g)和体积大小(cm)的变异程度,适宜的统计数是( D ) A.极差 B.方差 C.标准差 D.变异系数
6、圆桃与蟠桃(扁桃)杂交,所得F1代自交,培育出F2杂种实生苗174株,其中果实为圆形的126株,扁平形的48株,检验桃果形遗传是否符合3:1的分离规律的分析方法是( D ) A.方差的同质性检验 B.F检验 C.独立性检验 D.适合性检验
7、用标记字母法表示的多重比较结果中,如果两个平均数的后面标有不同小写英文字母,则它们之间差异( A )。
A. 在0.05水平上显著 B. 在0.05水平上不显著 C. 在0.01水平上显著 D. 在0.01水平上不显著
3
2
2
2
实用文档
x)(yy)x)(yy)228、
SPSSxSSy是( A )。
A.相关系数 B.决定系数 C.回归系数 D.回归平方和
9、进行玉米品种比较试验,7个品种,每品种得到3个产量观察值,则该试验误差自由度为( A ) A.14 B.18 C.6 D.2
10、用于反映资料离散性的特征数是( B ) A.变异系数 B.变异数 C.方差 D.标准差 五、简答
1、统计假设检验的基本步骤
1)对研究的总体提出假设
(2)确定假设的检验方法和显著水平 (3)计算统计数和无效假设真实的概率 (4)做出检验结论
2、何谓试验因素和水平?
试验因素是指在试验中能够变动并设有待比较的一组处理的因子,简称因素或因子。 试验因素的量的不同级别或质的不同状态称为水平。
3、 并各举一例质量水平和数量水平。
试验因素水平可以是定性的,也可以是定量的,如供试的不同品种,具有质的区别,属质量水平;生长素的不同浓度具有量的差异,属数量水平。
4.简述提高试验精确度和灵敏度的试验控制方法
为提高试验的精确度和灵敏度。必须严格控制试验条件的均匀性,使各处理处于尽可能一致的试验条件下。这一做法在统计上叫做试验控制。
5.简述提高试验精确度和灵敏度的统计控制方法。
验控制在某些情况下不一定能实施。例如,许多试验都希望各小区的种植密度完全一样,这就不容易达到;又如,研究水稻的结实率或棉花的蕾铃脱落率,要求各处理在单位面积上有相同的颖花数或蕾铃数,这就更难达到。在这些情况下,如果那个没有很好控制的因素x可以量测(如上述的株数、蕾铃数、颖花数等),而又和试验结果y存在着回归关系,那就可以利用回归,将各个y都矫正到x在同样水平(xx)时的结果。这一做法在统计上叫做统计控制。
六、计算
实用文档
1、已知某小麦良种的千粒重034g,现自外地引入一新品种,在8个小区种植,得其千粒重为(g):35,37,33,35,33,36,40,39。试测验新引入品种的千粒重是否显著高于当地良种的千粒重?(t0.1,71.895,
t0.05,72.365)
因为总体方差2未知,n8为小样本,所以用t检验;又因为要检验新引入品种的千粒重是否显著高于当地良种的千粒重,所以需作一尾检验。
H0:0,HA:0,
0.05(1分)
x(353739)/836
352372392(288)2/8s2.5635
81sxsn2.563580.9063
tx036342.21 sx0.9063t0.05,71.895(一尾)(2分),∵实得 t >t0.05 , ∴ p<0.05
推断:否定无效假设H0:0,即新引入品种的千粒重显著高于当地品种的千粒重。
2、某地连续7年测定≤25℃的始日(x)与粘虫幼虫暴食高峰期(y)的关系(x和y皆以8月31日为0),已经算得二级数据如下,试计算≤25℃的始日和粘虫幼虫暴食高峰期的相关系数和决定系数。
SSx539.7143 SSy422.8571 SP402.4286 x18.5714 y47.1429
解rSPSSxSSy402.4286539.7143422.85710.8424
(SP)2(402.4286)2r0.7096
SSxSSy539.71422.857123、根据2题数据测验相关系数的显著性。(r0.05, 5=0.754)
∵r0.8424
|r|>r0.05(2分)., ∴ p<0.05
推断: r在0.05水平上显著。
实用文档
因篇幅问题不能全部显示,请点此查看更多更全内容