《卫生统计学》练习题
一、 判断题
1、某地1956年婴儿死亡人数中死于肺炎占18%,1976年则占16%,故认 为20年来对婴儿肺炎的防治效果不明显。(× ) 2、研究人员测量了2006例患者外周血的红细胞数,所得资料为计数资料。( × ) 3、当样本含量越大时,率的标准误越大。 ( × ) 4、统计分析包括统计描述和统计推断。( √ )
5、只要增加样本含量到足够大,就可以避免Ⅰ和Ⅱ型错误( × )
6、变异系数总是小于1 ( ) 7、若两样本均数比较的假设检验结果P值等于0.000,则说明差异非常大。( × )8、非参数统计方法是用于检验总体中位数、极差等总体参数的方法。( × ) 9、同一资料的r值越小,则b值越小。( × )
10、两个大样本均数的比较,Z检验比t检验要准确。×
11、样本量增大时,可同时减少第一类错误和第二类错误。( )
12、收集资料是统计工作的的基础,因此要求及时、准确和完整。( ) 13、个体间的变异是抽样误差的主要来源。( )
14、两样本率比较可采用Z检验,也可采用四格表 2检验。( )
16、直线回归反映两变量间的依存关系,而直线相关反映两变量间的相互直线关系。( 17、两变量关系越密切r值越大。( )
18、.描述一群呈正态分布变量值的集中位置,可选用平均数。(× ) 19、对于任何分布的资料,P10~P90范围内包含了80%的变量值。( ) 20、对于任何分布的资料,P15~P95范围内包含了80%的变量值。
( ) 21、对于任何分布的资料,P5~P95范围内包含了90%的变量值。( )
22、用某药治疗某种病患者4例、3例治愈,不计算治愈率为75%,其理由是推断总体治愈率的可信区间太宽 ( ) 23、某病住院日的分布呈中间高两边低,平均住院日为10天,中位数为5天,可以
看出住院日的分布是正偏态峰的 ( ) 24.某病住院日的分布呈中间高两边低,平均住院日为5天,中位数为10天,可以看出住院日的分布是正偏态峰的。( × )
25、抽样误差是表示个体值与总体参数值之差。( × ) 26、搜集资料是统计工作的基础,因此要求及时准确完整。( ) 27、通常单侧检验较双侧检验更为灵敏,更为检验出差别,因此宜广泛使用(× ) 28、正态分布一定是对称分布,故对称分布必为正态分布。( × ) 29、正态分布中均数和中位数相等。( ) 30、若两样本均数比较的假设检验结果P值远远小于0.01,则说明差异非常大(× ) 31、若两样本率比较的假设检验结果P值等于0.000,则说明差异非常大。(× ) 32、对同一参数的估计,99%可信区间比90%可信区间好。( × ) 33、某儿童保健所,测定100名同年龄性别儿童的身高、体重和胸围 ,可用方差分析来检验这三项指标差异有无显著性。( × ) 34、均数总是比标准差大。( × ) 35、均数总是大于中位数。( × )
36、样本均数大时,标准差也一定会大。(× ) 37、变异程度的指标数值越小,均数代表性越好。( )
1
)
38、、方差分析的基本思想SS总=SS组间+SS组内。 ( ) 39、完全随机设计的方差分析中,必然有 SS总=SS组间+SS组内。( )
40、某化工厂某病连续4年患病率分别为6.30%、9.7%、11.0%、15.4%,则该病4年
总 患病率为:(6.0+9.7+110.0+15.4)/4=10.53% ( × ) 41、因秩和检验适用范围广泛,故对资料进行统计处理时,首选秩和检验 ( × )
242、四个样本率做比较,20( ) .05(3) ,可认为各总体率不全相等。
243、四个样本率比较的假设检验,20.05(3) ,可认为各总体率均不相等。×
44、Sy.x愈大,说明实测点距回归直线的纵向距离愈近。( × )
45、百分条图表示事物各组成部分在总体中所占比重,以长条的全长为100%,按资料的大小或逻辑顺序依次进行绘制。( )
46、 “最小二乘”是指观察值和回归方程计算值之差的总和最小。( × )
47、 多组均数比较的方差分析的Dunnett检验适用于多个均数两两之间的全面比较。( ) 48、相关系数的假设检验P值愈小,则说明两变量X与Y的关系愈密切。 ( × ) 49、可直接比较不同地区寿命表中的预期寿命。( ) 50、同一资料中样本回归系数b<0,P>0.05,可认为两变量呈负相关。 ( × ) 51、同一资料的r>0,则b<0。( × )
52、计量资料、计数资料和等级资料可根据分析需要相互转化。( )
53、圆图表示事物各组成部分在总体中所占比重,以圆的面积表示事物的全部,用扇形的面积表示各部分的比重。( )
54、条图、线图和半对数线图都有纵轴与横轴且它们的纵轴单位都要从0开始。(× ) 55、对同一个样本资料必然有
,
。 ( × )
56、统计推断包括总体均数或总体率的估计及其假设检验。( ) 57、假设检验的作用是检验是否存在随机抽样误差。( × ) 58、标化率都可直接进行比较。(× ) 59、Sy.x为观察值y距回归直线的标准差,如果变量x与y的相关系数r=1,则Sy.x=0。 ( )
60、已知时,总体均数的95可信区间可用x1.96表示。 ( ) 61、如果直线相关系数r=1,则SS总=SS回。 ( ) 62、如果样本不是通过随机抽样得来的,假设检验就失去意义。 ( )
二、最佳选择题
1、计算某抗体滴度的平均水平,一般选择 ( )
A、X B、G C、M D、S
2、偏态分布宜用( )描述其分布的集中趋势。
A、算术均数 B、标准差 C、中位数 D、四分位数间距 3、描述一组偏态分布资料的变异度,以( )指标较好。
A、全距 B、 标准差 C、变异系数 D、四分位数间距
4、总体是由 ( ) A.个体组成 B. 研究对象组成 C.同质个体组成 D. 研究指标组成
2
5、观察单位为研究中的 ( ) A.样本 B. 全部对象 C.影响因素 D. 个体
6、关于标准差,那项是错误的 。 ( ) A.反映全部观察值的离散程度 B.度量了一组数据偏离平均数的大小 C.反映了均数代表性的好坏 D.不会小于算术均数 7、标准正态分布的均数与标准差分别为 ( ) A.0与1 B.1与0 C.0与0 D.1与1 8、以下指标中( D )可用来描述计量资料的离散程度。( )
A、算术均数 B、几何均数 C、中位数 D、标准差
9、将100名病人随机等分成两组后分别给予A、B方案治疗,疗效按等级划分为治愈、好转、有效和无效。欲知两种方案的疗效何者较优,宜作
2
A、两样本均数比较的t检验 B、两组多类构成比比较的检验 C、两样本率比较的假设检验 D、两样本比较的秩和检验 10、对于配对比较的秩和检验,其检验假设为( )。
A、样本的差数应来自均数为0的正态总体 B、样本的差数应来自均数为0的非正态总体 C、样本的差数来自中位数为0的总体
D、样本的差数来自方差齐性和正态分布的总体 11、由样本均数估计总体均数可靠性大小的指标是:( )
A、标准差S B、标准误 C、方差 D、变异系数 12、两样本均数比较的t检验,差别有统计意义时,P越小,说明( )。 A、两样本均数差别越大 B、两总体均数差别越大
C、越有理由认为两总体均数不同 D、越有理由认为两总体均数相同
13、各观察值均加或均减同一位数后: ( )
A、均数不变,标准差改变 B、均数改变 ,标准差不变 C、两者都改变 D、两者都不变
14、配对样本差值的Wilcoxon符号秩检验,确定P值的方法为( )。
A、T越大,P越大 B、T越大,P越小
C、T值在界值范围内,P小于相应的 D、T值在界值范围内,P大于相应的 15、标准正态分布曲线下中间90%的面积,所对应横轴尺度U的范围是 ( ) A、-1.645到+1.645 B、-1.960到+1.960 C、-2.580到+2.580 D、-1.68到+1.960
2
16、四个样本率作比较,Х2 >Х0.01(3) ,可认为: ( )
A、各总体率不等或不全相等 B、各总体率均不相等
C、各样本率均不相等 D、各样本率不等或不全相等 17、为了由样本推断总体,样本应该是: ( )
A、总体中任意一部分 B、总体中的典型部分 C、总体中有意义的一部分 D、总体中有代表性的一部分
18、要评价某市一名8岁女孩的身高是否偏高或偏矮,应选用的统计方法是:( )
A、用该市8岁女孩的身高的95%或99%参考值范围来评价
B、作身高差别的假设检验来评价 C、用身高均数的95%或99%可信区间来评价 D、不能作评价
19、用某药治疗某种病患者5例,4例治愈,宜写为4/5,而不计算治愈率为80%,其理由
3
是( )
A、样本治愈率的可信区间太宽 B、样本治愈率的可信区间太窄 C、总体治愈率的可信区间太宽 D、总体`治愈率的可信区间太窄 20、样本均数的抽样误差是不可避免的,下述哪种情况使其减少。( ) A、设法减少总体标准差 B、设法减少样本标准差 C、设法增大总体标准差 D、增大样本含量
21、甲乙两人分别从随机数字表抽得30个(各取两位数字)随机数字作为两个样本,求得X1和S1;X2和S2,则理论上( )。
A、X1X2 B、S1S2
C、由甲、乙两样本均数之差求出的总体均数95%可信区间,很可能包括0 D、作两方差齐性的F检验,必然方差齐
22、数列8、-3、5、0、1、4、-1的中位数是( )。
A、2 B、1 C、2.5 D、0.5
23、某地2006年随机抽取100名健康女性,算得其血清总蛋白含量的均数为74g/L,标准差为4g/L,则其95%的参考值范围( )。
A、7444 B、741.964 C、742.584 D、742.58410 24、下述资料用何种指标反映抗体平均滴度较合适( )
抗体滴度:≤1:4 1:8 1:16 1:32 1:64 人 数 : 8 12 16 14 7
A、几何均数 B、中位数 C、算术均数 D、中位数和几何均数 25、一组变量的标准差将( )。
A.随变量值的个数 n 的增大而增大 B.随变量值的个数 n 的增加而减小 C.随变量值之间的变异增大而增大 D.随系统误差的减小而减小 26、参数是指( )。
A、参与个体数 B、描述总体特征的统计指标 C、描述样本特征的统计指标 D、样本的总和
27、正态分布有两个参数与,( )相应的正态曲线的形状越扁平。 A、越大 B、越小 C、越大 D、越小
222228、从样本得到变量X与Y的相关系数r=0.92, 则
A、X与Y之间一定存在因果关系 B、若对此份资料作回归分析, 其回归系数是正值 C、若对此份资料作回归分析, 其回归系数是负值 D、表明总体相关系数0 29、已知r=1,则一定有( )。
A、b=1 B、a=1 C、b>0 D、b<0 30、符合方差分析检验条件的成组设计资料如果采用秩和检验,则( )。
A、第一类错误增大 B、第二类错误增大C、第一类错误减小 D、第二类错误减小 31、某地调查25岁男大学生2009名,身高标准差为4.09cm,体重标准差为4.10kg,比较两者
的变异程度,结果 ( )
A. 体重变异度大 B.身高变异度较大
C.两者变异度相同 D.由单位不同,两者标准差不能直接比较
4
32、数列7、-3、5、0、1、2、-1的中位数是 ( ) A. 2 B. 1 C. 2.5 D.0.5 33正态曲线下,横轴上,从均数到+∞的面积为( )。
A.95% B.50% C.97.5% D.不能确定(与标准差的大小有关) 34、多样本计量资料的比较,当分布类型不清时选择( )。 A、t检验 B、检验 C、u检验 D、H检验
235、等级资料比较宜用:( )
A. t检验 B.2检验C.秩和检验 D.F检验 36、关于标准差,那项是错误的( )。
A、反映全部观察值的离散程度 B、度量了一组数据偏离均数的大小 C、反映了均数代表性的好坏 D、不会小于算术均数 37、完全随机设计方差分析中的组间均方是( )的统计量。 A、表示抽样误差大小 B、表示某处理因素的效应作用大小 C、表示某处理因素的效应和随机误差两者综合影响的结果 D、表示n个数据的离散程度
38、配对设计资料的符号秩检验中,如相同秩次过多,未计算校正uc值,而计算u值,不
拒绝H0时( )。
A、第一类错误增加 B、第一类错误减少C、第二类错误增加 D、第二类错误减小 39、行×列表的 χ2检验应注意 :( )
A.任一格理论数小于5,则要用校正公式 B.任一格理论数小于5,则要将相应组合并 C.若1/5以上格子理论数小于5,则要用校正公式 D.若1/5以上格子理论数小于5,则要考虑合理并组
40、配对比较的秩和检验的基本思想是:如果假设成立,则对样本来说:( ) A.正秩和的绝对值大于负秩和的绝对值 B.负秩和的绝对值大于正秩和的绝对值 C.正秩和与负秩和的绝对值相等 D.正秩和与负秩和的绝对值不会相差很大 41、设配对设计资料的变量值为X1和X2,则配对资料的秩和检验 ( ) A.把X1与X2的差数绝对值从小到大编秩 B.把X1和X2综合从小到大编秩
C.把X1和X2综合按绝对值从小到大编秩 D.把X1与X2的差数从小到大编秩
42、表示某地区某年各种死因的构成比,可绘制 ( ) A. 条图 B. 圆图 C. 直方图 D. 统计地图
43、比较某地在两个年份几种传染病的发病率可用 ( )
A. 构成比条图 B. 复式条图 C. 线图 D. 直方图
44、欲比较两地20年来冠心病和恶性肿瘤死亡率的上升速度,最好选用 ( ) A. 普通线图 B. 半对数线图C. 条图 D. 直方图
45、 调查某地6至16岁学生近视情况,需描述近视学生的年龄分布可用 ( ) A. 普通线图 B. 半对数线图 C. 条图 D. 直方图 46、、图示7岁男童体重与胸围的关系,宜绘制:( ) A.条图 B.散点图 D.线图 E.直方图 47、以下关于参数点估计的说法正确的是( )
5
A、 CV越小,表示用该样本估计总体均数越可靠 B、 B、X越小,表示用该样本估计总体均数越准确 C、X越大,表示用该样本估计总体均数的可靠性越差 D、S越小,表示用该样本估计总体均数越可靠
48、从样本得到变量X与Y的相关系数r=0.99, 则 ( )
A.X与Y之间一定存在因果关系
B.若对此份资料作回归分析, 其回归系数是正值 C.若对此份资料作回归分析, 其回归系数是负值 D.表明总体相关系数0
49、如果直线相关系数r=1,则一定有( )。
A、SS总=SS残 B、SS残=SS回 C、SS总=SS回 D、SS总>SS回 50、直线回归系数假设检验,其自由度为( )。
A、n B、n-1 C、n-2 D、2n-1 51、在两样本均数比较的t检验中,无效假设是( )。 A、两样本均数不等
B、两样本均数相等 C、两总体均数不等 D、两总体均数相等
52、某病患者9人的潜伏期如下:1、2、3、3、3、4、5、6、30则平均潜伏期为 ( ) A.均数为7天,很好的代表了大多数的潜伏期 B.中位数为3天 C.中位数为4天
D.中位数为3.5天,不受个别人潜伏期长的影响 53、两样本比较时,分别取以下检验水准,下列何者所取第二类错误最小 ( )A.=0.05 B.=0.01 C.=0.15 D.=0.20 54、( )小,表示用该样本均数估计总体均数的可靠性大。 A、CV B、S C、X D、 R
55、正态曲线下、横轴上,从均数到均数+1.96倍标准差的面积为 ( ) A.98.5% B.45% C.97.5% D.47.5%
56、正态曲线下、横轴上,从均数-2.58倍标准差到均数的面积为 ( ) A.49.5% B.45% C.97.5% D.98.5%
57、正态曲线下、横轴上,从均数-1.96倍标准差到均数的面积为( )。 A、95% B、45% C、97.5% D、47.5% 58、通常可采用以下那种方法来减小抽样误差:( )
A、减小样本标准差 B、减小样本含量 C、扩大样本含量 D、以上都不对 59、完全随机设计方差分析的检验假设是( )。
A、各处理组样本均数相等 B、各处理组总体均数相等 C、各处理组样本均数不相等 D、各处理组总体均数不相等 60、第一类误差α和第二类误差β的关系有:( )
A.α>β B.α<β C.α愈大β愈大 D.α愈大β愈小
61、对同一种患者分两组(每组100人)用两种方法治疗,甲法有效60人,无效40 人;乙法有效50人,无效50人。若要检验甲法和乙法的疗效有无差别,采用 ( ) A. t检验或非参数T检验 B. χ2检验或t检验
6
C. χ2检验或u检验 D. χ2检验或H检验
62、 关于构成比的叙述,下列哪项是正确的? ( )
A.反映某现象发生的强度 B.反映某事物内部各部分占全部构成的比重 C.既反映某现象发生的强度,也反映某事物内部各部分占全部构成的比重 D.表示两个同类指标的比
63、以下指标中__________可用来描述计量资料的离散程度。
A.算术均数 B.几何均数 C.中位数 D.标准差
64、以下说法正确的是 ( ) A.两个样本率的比较可用u(Z)检验也可用2检验 B.两个样本均数的比较可用u(Z)检验也可用2检验 C.对于多个率或构成比的比较,u(Z)检验可以替代2检验 D.对于两个样本率的比较,2检验比u(Z)检验可靠
65、某地2008年随机抽取100名健康女性,算得其血清总蛋白含量的均数为72g/L,标准差为4g/L,则其95%的参考值范围 ( ) A.7244 B.721.964 C.722.584 D.722.58410
66、关于标准差,那项是错误的 。 ( )
A.反映全部观察值的离散程度 B.度量了一组数据偏离平均数的大小 C.反映了均数代表性的好坏 D.不会小于算术均数
67、用最小二乘法确定直线回归方程的原则是各观察点 ( ) A.距直线的纵向距离相等
B.距直线的纵向距离的平方和最小 C.与直线的垂直距离相等
D.与直线的垂直距离的平方和最小 68、方差分析结果,F处理>F0.05,(,),则统计推论是 ( )
12A. 各总体均数不全相等 B. 各总体均数都不相等 C. 各样本均数都不相等 D. 各总体方差不全相等
69一组变量的标准差将 ( ) A.随变量值的个数n的增大而增大 B.随变量值的个数n的增加而减小 C.随变量值之间的变异增大而增大 D.随系统误差的减小而减小
70、随机区组设计要求 ( ) A.区组内个体差异小,区组间差异大 B.区组内没有个体差异,区组间差异大 C.区组内个体差异大,区组间差异小 D.区组内没有个体差异,区组间差异小
三、计算分析题
1、用甲乙两种方法检查已确诊的乳腺癌患者120名。甲法的检出率为60%,乙法的 检出率为50%,甲、乙两法一致的检出率为35%,问:
7
(1)该资料为何种设计类型?属于什么性质的资料? (2)列出计算检验统计量的计算表 (3)甲、乙两法何者为优?
(4)据你所作的结论,可能犯何种类型的统计错误?
2、用两种方法对80例腺病毒性肺炎患者进行检测。其中两种方法均为阳性者40 例;两种方法均为阴性者20例;甲法阳性乙法阴性者9例;甲法阴性乙法阳性者11例。 (1)该资料为何种设计类型?属于什么性质的资料? (2)列出计算检验统计量的计算表。 (3)分别计算两种方法检测的阳性率。 (4)甲、乙两法何者为优?
(5)据你所作的结论,可能犯何种类型的统计错误?
3、某医生随机检测了某地225名健康成年男子的血清胆固醇含量,得
X=4.0(mmol/L),S=0.6(mmol/L)。
(1)、指出本研究的总体、观察单位(或研究单位)和变量。 (2)、本研究的抽样误差为多少? (3)、试估计某地健康成年男子的血清胆固醇含量总体均数的95%的可信区间。 (4)、试估计某地健康成年男子的血清胆固醇含量的95%的医学参考值范围。 (5)指出SX减少代表的意义。
4、某医生随机检测了某地400名健康成年男子的某指标值,得X=10.0,S=1.20。 (1)、指出本研究的总体和观察单位(或研究单位)。 (2)、本研究的抽样误差为多少? (3)、试估计某地健康成年男子的某指标值总体均数的99%的可信区间。 (4) 试估计某地健康成年男子的某指标值的95%的医学参考值范围。 (5)指出SX减少代表的意义。
5、某胸科医院,同时用甲、乙两法测定200份痰标本中的抗酸杆菌,结果如下表。问甲、
乙两法的检出率有无差别?
甲、乙两法检测痰标本中的抗酸杆菌结果
乙 法
甲 法
+ - 合计
+ 48 28 76 - 22 102 124 合计 70 130 200
6、某地随机抽样调查了部分健康成男性的红细胞数和血红蛋白量,结果如下表: 某年某地健康成年人的红细胞数和血红蛋白含量
指 标
红细胞数(1012/L) 血红蛋白(g/L)
例数 225 225
均数 4.79 136.0
标准差 标准值* 0.50 6.2
4.84 140.0
请就上表资料:
(1)说明男性的红细胞数与血红蛋白含量的变异程度何者为大? (2)计算男性两项指标的抽样误差。
8
(3)试估计该地健康成年男性红细胞数的均数。
(4)该地男性红细胞数是否均低于上表的标准值(若测定方法相同) 7、某地随机抽样调查了部分健康成人的红细胞数和血红蛋白量,结果如下表:
某年某地健康成年人的红细胞数和血红蛋白含量 指 标 红细胞数(1012/L) 血红蛋白(g/L)
请就上表资料:
(1) 说明女性的红细胞数与血红蛋白的变异程度何者为大? (2) 计算男性两项指标的抽样误差。
(3) 试估计该地健康成年女性红细胞数的均数。
(4) 比较该地健康成年男、女血红蛋白含量是否不同,应使用何种假设检验方法?(不 必计算)
(5) 若计算得到的检验统计量大于相应检验水准α=0.05时该检验统计量的临界值时,你如何下结论?可能犯何种类型的统计错误?犯错误的概率有多大?(5分)
8、某医科大学附属医院对120例曾用过洋地黄药与50例未用过洋地黄药的肺心病患者作心电图检查,结果曾用过洋地黄药患者发生心律失常80例,未用过洋地黄药患者发生心律失常20例。
(1)该研究为何种类型的设计?属于什么性质的资料? (2)列出计算检验统计量的计算表
(3)两组病人的心律失常发生率有无差别?
(4)据你所作的结论,可能犯何种类型的统计错误? 9、某研究人员采用不同浓度的含铅饲料喂养大白幼鼠,以观察铅污染对幼鼠脑铅含量的影响,资料如下:
不同铅浓度的饲料对幼鼠脑铅含量的影响
性别 男 女 男 女
例数 100 225 100 225
均数 4.50 4.00 130.0 120.0
标准差 0.50 0.30 8.0 10.0
组 别 n 脑铅含量
)
±S(10
-4
低剂量组 6 5.226±0.627
高剂量组 6 6.418±0.772
对照组 6 4.778±0.579
研究者用成组比较t检验对三组脑铅浓度做假设检验,结果表明:高剂量组与对照组差别有统计学意义(P<0.05),而低剂量组与对照组差别无统计学意义(P>0.05)。你认为此分析方法是否合理,为什么?简述其理由,并请提出你认为合理的分析方法。(写出具体步骤,
9
不必计算)
10、 某医院对12例慢性苯中毒患者用中草药抗苯一号治疗,测得白细胞计数如下:(单
位:10 9/L)
患者编号 1 2 3 4 5 6 7 8 9 10 11 12 治疗前 6.0 4.8 5.0 3.4 7.0 3.8 6.0 3.5 4.3 4.9 6.4 5.3 治疗后 4.2 5.4 6.3 3.8 4.4 4.0 5.9 3.0 5.0 5.1 6.5 4.8
问:
(1) 该实验设计属何种设计? (2)该资料属何种类型资料?
(3)欲分析该药对白细胞数是否有影响,宜选用何种假设检验方法?
(4) 若计算得到的检验统计量大于相应检验水准α=0.05时该检验统计量的临界值时,你如何下结论?可能犯何种类型的统计错误?犯错误的概率有多大?
11、为探讨复方黄芪冲剂治疗佝偻病的疗效,某医师将80例患者随机分为两组, 复方黄芪冲剂治疗50例,有效25例,有效率50.0%,钙片组治疗30例,12例有效,有效率40.0%。 (1)该研究为何种类型的设计? (2)属于什么性质的资料?
(3)列出计算检验统计量的计算表。 (4)计算理论频数。
(5)两药治疗慢性咽炎的有效率有无差别?
12、用兰芩口服液治疗慢性咽炎患者100例,有效者60例;用银黄口服液治疗慢性咽炎患者80例,有效者20例。
(1)该研究为何种类型的设计?属于什么性质的资料? (2)列出计算检验统计量的计算表
(3)两药治疗慢性咽炎的有效率有无差别?
(4)据你所作的结论,可能犯何种类型的统计错误? 四、名词解释
1、总体2、抽样误差3、标准误 4、标准差 5、变异 6、极差7、参数检验 8、非参数检验 9、参数 10、参数估计11、统计推断12、统计量 13、中位数 14、四分位数间距15、正态分布 16、标准正态分布17、率 18、构成比 19、直线回归20、直线相关 21、相关系数 22、回归系数23.抽样误差24、变异系数 五、填空题
1、统计分析包括 和 。
2、统计推断包括两个重要方面是_____________和_____________。 3、四分位数间距是——和——的差。
4、描述正态分布的计量资料两个参数是 和 。
5、常用的统计资料类型分 、 和 。 6、常用平均数有均数、———和中位数。
7、血清学滴度资料最常用来表示其平均水平的指标是_____________。 8、常用相对数有率、 和相对比。
9、总体均数区间估计的两个要素是 和 。 10、t检验分布曲线的形状与———有关。
11、成组t检验的自由度为 ,检验的自由度为 。 12、四格表资料的χ检验,其自由度为_____________。
10
2
2
13、t检验分布曲线的形状与_____________有关。
14、随机区组设计的方差分析,可将总变异分解为———————————。 15、变异系数用于①———————————————————————;
②———————————————————————。
16、正态分布曲线下,横轴上从μ-1.96σ到μ范围内的面积为_____________。
17、横轴上,正态曲线下,从μ-1.96σ到μ+2.58σ的面积为 。
18、S—X大小与 成正比。
19、确定医学正常值范围,习惯上以95%为界值。若资料是正态分布,应计算(双侧)________________,若资料呈偏态分布,应计算_________________及____________________。
20、X服从N(5,2)的正态分布,X的P50为———。 21、X服从N(3,2)的正态分布,X的P97.5为:———。 22.X服从N(5,2)的正态分布,X的P2.5为:_____________。 23、X服从N(4,2)的正态分布,X的P97.5为:_____________。 24、对于任何分布的资料,P5~P95的范围包含了 变量值。
25、比较某地区某时期三种疾病的发病率在各年度的发展速度,应该绘制 。 26、某地1980年~1990年结核病死亡率变动趋势应绘制_____________图;表示两种现象
间的相关关系绘制_____________图。
27、表示事物发展速度的资料宜用_____________图,说明某现象随另一现象变迁的资料
宜用_____________图。
28、反映某地某种传染病随时间变化的速度宜绘制______________________图。 29、p1.96Sp表示———————————————————————。
30、率的抽样误差,通常用_____________表示。
31、随机区组设计的方差分析,可将总变异分解为_____________。
32、完全随机设计的方差分析,可将总变异分解为———————————。
33、资料8、3、2、7、10的算术均数等于_____________,其中位数等于_____________。
34、两个样本均数比较的t检验,其应用条件为:———————————————— 和—————————————————。
1_________;○2_____________。 35、变量系数常用于: ○
36、两个率比较的χ检验,其自由度为———。 2
37、三个样本率比较的χ检验,其自由度为_____________。 38、根据资料的 和 选用合适的统计图。 39、相关系数r的假设检验,H0表示为———————。 40、回归系数b的假设检验,H0表示为———————。
1__________________________○2_______________________○341、t检验的应用条件○
__________________。
42、收集资料的任务是取得________________ 的原始资料,而整理资料的目地是使原始
2
2222 11
数据处理_______________ 便于进一步计算和分析指标。
43、对于多个样本的秩和检验,当R=3,ni>5时,应查_________________表。 44、正态分布的两个参数是_____________和_____________。 45、σ是指———对μ的离散程度;X是指———对μ的离散程度。
46、非参数检验较参数检验的检验效能_____________。 47、符合参数检验条件的资料,如采用非参数检验方法,一般情况下,犯第______________
类错误的概率增大。
48、对于多个样本的秩和检验,当R=3,ni>5时,应查_____________表。
49、某病住院日的分布呈中间高两边低,平均住院日为5天,中位数为10天,可以看出
住院日的分布是 。
50、一完全随机设计的计量资料,有4个处理组,每组的例数分别为13、22、17、8,方差分析时其误差项的自由度为____________________。
六、简答题
1、试述应用相对数应注意的问题?
2、简述定量变量值频数表的制定步骤与内容。 3、正态分布与标准正态分布联系与区别。
4、简述配对设计资料的符号秩和检验的基本步骤。
5、简述假设检验与区间估计的联系。
6、试总结从样本数据判断总体回归关系是否成立的统计方法有哪些
7、试举例说明均数的标准差与标准误的区别与联系。 8、为什么假设检验的结论不能绝对化?
9、什么叫做秩转换的非参数检验?它适用于哪些情况? 10.直线回归与直线相关的区别有哪些?
11、医学参考值范围的意义和制定方法是什么?
12、.以两样本均数比较的t检验为例,说明假设检验的基本步骤。 13、简述四格表资料2 检验公式选择条件:
14、随机区组设计的方差分析与完全随机设计方差分析在设计和变异分解上有什么不
同?
12
答案
一、判断题
1、× 2、× 3、× 4、√ 5、× 6、×7、× 8、× 9、× 10、×11、√ 12、√ 13、√ 14、√ 16、√ 17、×18、× 19、√ 20、√ 21、√ 22、√ 23、√ 24、× 25、× 26、√ 27、× 28、× 29、√ 30、× 32、× 33、× 34、× 35、× 36、× 37、√ 38、√ 39、√ 40、× 41、× 42、√ 43、× 44、× 45、√ 46、× 47、× 48、× 49、√ 50、× 51、× 52、√ 53、√ 54、× 19、×55、× 56、√ 57、× 58、× 59、√ 60、× 61、√ 62、√ 二、最佳选择题 1 B 11 B 21 C 31 D 41 A 51 D 61 C 2 C 12 C 22 B 32 B 42 B 52 B 62 B 3 D 13 B 23 B 33 B 43 B 53 D 63 D 4 C 14 D 24 B 34 D 44 B 54 C 64 A 5 D 15 A 25 C 35 C 45 D 55 D 65 B 6 D 16 A 26 B 36 D 46 B 56 A 66 D 7 A 17 D 27 C 37 C 47 C 57 D 67 B 8 D 18 A 28 B 38 A 48 B 58 C 68 A 9 D 19 C 29 C 39 D 49 C 59 B 69 C 10 C 20 D 30 B 40 D 50 C 60 D 70 A 四、名词解释题
1、总体:是根据研究目的确定的同质的观察单位的全体,更确切的说,是同质的所有观察单位某种观察值(变量值)的集合。总体可分为有限总体和无限总体。
2、抽样误差:由于抽样造成的样本统计量与总体参数的差异,称为抽样误差,是由个体变异产生的。
3、SX:标准误的点估计值,它反映了样本均数间的离散程度,也反映了样本均数与总体均数的差异,说明均数抽样误差的大小。
4、S:样本标准差,是描述一组变量值离散程度的统计指标。常用于正态分布或近似正态分布的资料,标准差小,均数的代表性好。
5、变异:个体间测量结果的差异称为变异。变异是生物医学研究领域普遍存在的现象。严格的说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值的参差不齐。
6、极差亦称全距,即最大值与最小值之差,用于资料的离散程度的粗略分析,其计算简便但稳定性较差。
7、参数检验:以特定的总体分布为前提,对总体参数进行假设检验的一类检验方法。 8、非参数检验:是一种不依赖总体分布的具体形式的统计检验方法。检验的是分布,不是参数。
9、参数:是反映总体的指标,如总体均数、总体率等,总体参数是固定的常数。 10、参数估计:指用样本统计量估计总体参数。参数估计有两种方法:点估计和区间估
13
计。
11、统计推断:通过样本指标来说明总体特征,这种通过样本信息获取总体特征的过程称为统计推断。统计推断包括两个方面的重要内容:一是参数估计,二是假设检验。 12、统计量:是指与总体参数相对应的样本统计指标,如样本均数、样本率等,样本统计量可用来估计总体参数,统计量是在总体参数附近波动的随机变量。 13、中位数:将一组观察值由小到大排列,位次居中的那个数。
14、四分位数间距是由第3四分位数(P75)和第1四分位数(P25)相减计算而得,常与中位数一起使用,描述偏态分布资料的分布特征,较极差稳定。
15、正态分布:若资料X的频率曲线对应于数学上的正态曲线,则称该资料服从正态分布。通常用记号N(,)表示均数为,标准差为的正态分布。
16、标准正态分布:均数为0,标准差为1的正态分布。
17、率:又称频率指标,说明一定时期内某现象发生的频率或强度。计算公式为:
发生某现象的观察单位数 , 表示方式有:百分率(%)、千分
率100%可能发生某现象的观察单位总数
率(‰)等。
18、构成比又称构成指标,说明某一事物内部各组成部分所占的比重或分布。计算公式
2某一组成部分的观察单位数为: 构成比100%,通常以百分数表示。 同一事物各组成部分的观察单位总数
19、直线回归:建立一个描述应变量依自变量变化而变化的直线方程,并要求各点与该 直线纵向距离的平方和为最小。直线回归是回归分析中最基本、最简单的一种,故又称 简单回归。
20、直线相关:直线相关又称线性相关、简单相关,用于双变量正态分布的资料,有正相关 负相关和零相关等关系。直线相关的性质可用散点图直观地说明。
21、相关系数:相关系数又称积差相关系数,以符号r表示样本相关系数,ρ表示总体相关系数。它是说明具有直线关系的两个变量间,相关关系的密切程度与相关方向的指标。 22、回归系数:在直线回归方程中用b表示,是描述变量间依存关系的方向和变化幅度的统计指标,b的统计意义为X每增(减)一个单位时,Y平均改变b个单位
23、变异系数:变异系数属于变异指标,适合于正态分布或者近似正态分布的资料,常用于比较均数相差较大或度量衡单位不同的观察值的变异程度,计算公式为cv五、填空题:
1、统计描述、统计推断 2、参数估计、假设推断 3、p75和p25 4、和
5、计量资料、计数资料、等级资料 6、几何均数 7、几何均数 8、构成比
14
s100%。 x
9、准确度、精密度 10、自由度
11、n1n22、(R-1)(C-1) 12、1
14、ss总ss处理ss区组ss误差 15、均数相差悬殊、度量衡单位不同 16、50% 17、97%
18、抽差误差
19、x1.96s,p2.5p97.5 20、5 21、6.92 22、1.08 23、7.92 24、90%
25、半对数线图
26、普通线图、散点图
27、半对数线图、普通线图 28、半对数线图
29、总体率的95%可信区间 30、sp
32、ss总ss组间ss组内
33、6、7
34、两样本来自正态分布的总体、两总体方差相等或齐性。36、1 37、2
38、性质、分析目的 39、0 40、0
41、随机性、正态性、方差齐性 42、准确可靠、系统化、条理化 43、x2界值
45、总体个体值、样本均数 46、低 47、Ⅱ
49、负偏态分布
15
50、57
六、简答题:
1、答:应用相对数应注意事项:
(1)算相对数时分母应该有足够数量; (2)分析时不能以构成比代替率;
(3)分别将分子和分母合计求合计率或平均率; (4)相对数的比较应该注意其可比性; (5)样本率或构成比比较时应做假设检验 2答:
(1)求全距:R=最大值-最小值
(2)求组距:i=R/组数 一般分为10-15组
(3)确定组限:第一组包括最小值,最后一组包括最大值,L≤x<U
(4)划记汇总:将所有观察值逐一划记到各组段,并统计各组段的频数和总频数。 3、答:二种分布均为连续型随机变量的分布。正态分布、标准正态分布均为对称分布。标准正态分布是一种特殊的正态分布(均数为0,标准差为1)。一般正态分布变量经标准化转换后的新变量服从标准正态分布。 4、答:基本步骤: (1)、求出各对数值的差值; (2)、建立检验假设,确定检验水准;
H0:差值总体中位数为零 H1:差值总体中位数不为零
0.05
(3)、编秩次
Ⅰ、按差值的绝对值自小至大排秩次,并保持原差数的正负号; Ⅱ、差数的绝对值相等符号相反时,取平均秩次; Ⅲ、差数为零时,弃之,总的对子数相应减少。
(4)求秩和:将正负秩次分别相加,得到T和T,任取正负秩和作为统计量T值; (5)查T界值表,确定p值范围,作出推断结论。
Ⅰ、当样本例数n≤50时,查配对资料符合秩和检验用T界值表,T愈小,p愈小,T在
Tn界内时,p>,当T恰为表中的界值时,p值一般都小于对应的概率值。
Ⅱ、当n>50时,按近似正态分布用u检验
uTn(n1)/40.5n(n1)(2n1)/24
当相同秩次较多时,采用校正公式:
uTn(n1)/40.5n(n1)(2n1)(ttj)24483j 按u界值确定p值范围,作出推断结论。
16
5、答:假设检验用于推断质的不同,即判断两个(或多个)总体参数中是否不同,而可信区间用于说明量的大小 ,即推断总体参数的范围。两者既相互联系,又不区别。假设检验与区间估计的联系在于可信区间亦可回答假设检验的问题,若算得的可信区间包含了
H0,则按水准,不拒绝H0,若不包含了H0,则按水准,拒绝H0,接受H1。也就是
说在判断两个(或多个)总体参数是否不等时,假设检验和可信区间是完全等价的。 6、答:用tb、tr作t检验;用F对b和R2作方差分析;直接查r界值表。
7、答:例如某医生从某地2006年的正常成年男性中,随机抽取25人,算得其血红蛋白的均数X为138.5g/L,标准差S为5.20g/L,标准误SX为1.04g/L。在本例中标准差就是描述25名正常成年男性血红蛋白变异程度的指标,它反映了这25个数据对其算术均数的离散情况。因此标准差是描述个体值变异程度的指标,为方差的算术平方根,该变异不能通过统计方法来控制。而标准误则是指样本统计量的标准差,均数的标准误实质是样本均数的标准差,它反映了样本均数的离散程度,反映了样本均数与总体均数的差异,说明了均数的抽样误差大小。本例均数的标准误SXSn5.20251.04,此式将标准差和标准误从数学上有
机地联系起来了,同时还可以看出:当标准差不变时,通过增加样本含量可以减少标准误。 8、答:因为通过假设检验推断作出的结论具有概率性,其结论不可能完全正确,有可能发生两类错误。拒绝H0时,可能犯I型错误;“接受”H0时可能犯II型错误。无论哪类错误,假设检验都不可能将其风险降为0,因此在结论中使用绝对化的字词如“肯定”,“一定”,“必定”就不恰当。
9、答:秩转换的非参数检验是先将数值变量从小到大,或等级从弱到强转换成秩后,再计算检验统计量,其特点是假设检验的结果对总体分布的形状差别不敏感,只对总体分布的位置差别敏感。它适用于:不满足正态或(和)方差齐性的小样本计量资料;分布不知是否正态的小样本资料;一端或两端是不确切数值的资料;等级资料。 10、答: 区别:
(1) 资料要求上:相关要求X、Y服从以变量正态分布,回归要求Y在给定某个X值时服
从正态分布,X是可以精确测量和严格控制的变量。
(2) 应用上:说明两变量间相互关系用相关,说明两变量依存变化的数量关系用回归。 (3) 意义上:r说明具有直线关系两变量间相互关系的方向与密切程度,b表示X每变化
一个单位所导致Y的平均变化量。 (4) 计算上:r =lXYl,bXY
lxxlXXlYY(5) 取值范围:-1≤r≤1,-∞<b<∞
(6) 单位:r没有单位,b有单位。 11、答:
医学参考值范围是指大多数正常人的解剖、生理、生化、免疫、等各种数据的波动范围,所谓正常人,并非一定是“健康人”,而是指排除影响研究指标因素的同质人群。制定医学参考值范围,首先要选择足够数量的正常人,对选定的人进行正确测定, 根据实际确定单侧还是双侧界值,并选取适当的百分范围,最后,采用相应的方法计算出参考值范围。估计医学参考值的范围方法有百分位数法和正态分布法,应根据资料类型和实际情况选择。 12、答: 基本步骤:
(1)1.建立检验假设,确定检验水准 假设有两种:
即检验假设(hypothesis under test to be tested),常称无效假设或零/原假设(null hypothesis):
17
记为H0: 1=2,
备择假设常称对立假设(alternative hypothesis)。:记为 H1 :12,(双侧)
12或1=0.05
2(单侧)
单双侧检验根据研究目的和专业知识确定。 检验水准:是预先设定的概率值,一般取=0.05 (2)选用适当的检验方法并计算相应的检验统计量。
根据研究设计资料类型和统计推断目的选择适当的检验方法,并计算相应的检验统计量。 (3)确定p 值,并作出推断结论。
根据算得的统计量值确定p值(p值是从H0规定的总体中随机抽样,得到现有统计量或更极端情况的概率),并与事先设定的检验水准比较,若P≤,则结论为按所取的检验水准,拒绝H0,接受H1,有统计学意义(统计结论)。可认为……不等或不同(专业结论)。 若P>,则结论为按检验水准,不拒绝H0,无统计学意义(统计结论)。还不能认为……不等或不同(专业结论)。
13、答:
(1)首先应分清是两样本率比较的四格表资料还是配对设计的四格表资料。 (2)对于两样本率比较的四格表资料,应根据各格的理论值T和总例数n的大小选择
2n40T5不同的计算公式:① 当且所有的时,用检验的基本公式
22(adbc)2n(AT)22或四格表资料检验的专用公式;②
(ab)(cd)(ac)(bd)T22(AT0.5)2n401T5当 但有时,用四格表资料检验的校正公式c或
T2(|ad-bc|-n)n2c=,或改用四格表资料的Fisher确切概率法;③当n40,
(a+b)(c+d)(a+c)(b+d)22或T1时,用四格表资料的Fisher确切概率法。
若资料满足两样本率u检验的条件,也可用u检验。
(3)对于配对设计的四格表资料,若检验两种方法的检测结果有无差别时①当
2c2(bc)(bc)40时,2;②当(bc)40时,
bc(bc1)2bc。
18
14、答: 区 别 点 设计
完全随机设计
采用完全随机化的分组方法,将全部试验对象分配到g个处理组(水平组),各组分别接受不同的处理。 三种变异:
随机区组设计
随机分配的次数要重复多次,每次随机分配都对同一个区组内的受试对象进行,且各个处理组受试对象数量相同,区组内均衡。 四种变异:
变异分解
SS总SS组间SS组内 SS总SS处理SS区组SS误差
(1)首先应分清是两样本率比较的四格表资料还是配对设计的四格表资料。 (2)对于两样本率比较的四格表资料,应根据各格的理论值T和总例数n的大小选择
2n40T5不同的计算公式:① 当且所有的时,用检验的基本公式
22(adbc)2n(AT)22或四格表资料检验的专用公式;②
(ab)(cd)(ac)(bd)T22(AT0.5)2n401T5当 但有时,用四格表资料检验的校正公式c或
T2(|ad-bc|-n2)nc=,或改用四格表资料的Fisher确切概率法;③当n40,(a+b)(c+d)(a+c)(b+d)22或T1时,用四格表资料的Fisher确切概率法。
若资料满足两样本率u检验的条件,也可用u检验。
(3)对于配对设计的四格表资料,若检验两种方法的检测结果有无差别时①当
(bc)2;②当(bc)40时,(bc)40时,bc22c(bc1)2bc。
19
因篇幅问题不能全部显示,请点此查看更多更全内容