【通用】抽样技术习题.doc

2022-04-21 来源：好走旅游网

实用型文档

习题一

1. 请列举一些你所了解的以及被接受的抽样调查。

2.抽样调查基础理论及其意义；

3. 抽样调查的特点。

4.样本可能数目及其意义；

5.影响抽样误差的因素；

6.某个总体抽取一个n=50的独立同分布样本，样本数据如下： 567 601 665 732 366 937 462 619 279 287

690 520 502 312 452 562 557 574 350 875 834 203 593 980 172 287 753 259 276 876 692 371 887 641 399 442 927 442 918 11 178 416 405 210 58 797 746 153 644 476

1）计算样本均值y与样本方差s;

2）若用y估计总体均值，按数理统计结果，ｙ是否无偏，并写出它的方差表达式； 3）根据上述样本数据，如何估计v(y)？

4）假定y的分布是近似正态的，试分别给出总体均值μ的置信度为80％，90％，95％，99％的（近

似）置信区间。

我们提供最优质的文档

实用型文档

习题二

一判断题

1 普查是对总体的所有单元进行调查，而抽样调查仅对总体的部分单元进行调查。

2 概率抽样就是随机抽样，即要求按一定的概率以随机原则抽取样本，同时每个单元被抽中的概率是可以计算出来的。

3 抽样单元与总体单元是一致的。 4 偏倚是由于系统性因素产生的。

5 在没有偏倚的情况下，用样本统计量对目标量进行估计，要求估计量的方差越小越好。 6 偏倚与抽样误差一样都是由于抽样的随机性产生的。 7 偏倚与抽样误差一样都随样本量的增大而减小。

8 抽样单元是构成抽样框的基本要素，抽样单元只包含一个个体。

9 抽样单元可以分级，但在抽样调查中却没有与之相对应的不同级的抽样框。

10 总体目标量与样本统计量有不同的意义，但样本统计量它是样本的函数，是随机变量。 11 一个抽样设计方案比另一个抽样设计方案好，是因为它的估计量方差小。 12 抽样误差在概率抽样中可以对其进行计量并加以控制，随着样本量的增大抽样误差会越来越小，随着n越来越接近N，抽样误差几乎可以消除。

13 抽样误差越小，说明用样本统计量对总体参数进行估计时的精度越低。 14 样本量与调查费用呈现线性关系，但样本量与精度却呈非线性关系。 15 精度和费用也是评价抽样设计方案优劣的两条准则。

16 简单随机抽样时每个总体单元都有非零的入样概率，但每个总体单元的入样概率是不同的。 17 当总体N很大时，构造一个包含所有总体单元名单的抽样框是有局限性的，这也是简单随机抽样的局限性。 18 设N=872，n=10。利用随机数字表抽取一个简单随机样本如下：128 157 506 455 127 789 867 954 938 622

19 设N=678 n=5 利用随机数字表抽取一个简单随机样本如下：556 485 098 260 485 20 在实际工作中，如果抽样比接近于1时，人们会采用全面调查

二填空题

1 抽样比是指( )，用( )表示。 2 偏倚为零的估计量，满足 ( )，称为( )。 3 简单随机抽样的抽样误差等于( )。

4 简单随机抽样时重复抽样的抽样误差等于( ) 5 抽样时某一总体单元在第m次被选入样本的概率是( ) 6 简单随机抽样时总体单元被选入样本的概率是( ) 7 某一样本被选中概率是( )。

8 大数定理是指( )的规律性总是在大量( )的观察中才能显现出来，随着观察次数( )的增大，( )影响将互相抵消而使规律性有稳定的性质。

9 中心极限定理证明了当( )增大时，观察值的均值将趋向于服从( )，即不论( )服

我们提供最优质的文档

实用型文档

从什么分布，在观察值足够多时其均值就趋向( )分布。

10 抽样调查的核心是估计问题，选择估计量的标准是( ) ( ) ( )。

三简答题

1 概率抽样与非概率抽样的区别

2 普查与抽样调查的区别

3何谓抽样效率，如何评价设计效果？

4 何谓三种性质的分布？它们之间的关系怎样？

5 简述抽样估计的原理。

四计算题

1 已知总体N={5，6, 7，8，9 ，10，11}，n=5 试求： (1) 重复抽样与不重复抽样的所有可能样本数。 (2) 第一个单位在第m次被选入样本的概率 (3) 第一个单位被选入样本的概率 (4) 抽到{5,6，7,8，9}的概率

(5) 不放回简单随机抽样的所有可能样本

2某调查公司受一消费品生产公司的委托，想在某一地区进行一项民意测验，了解消费者中喜欢该

我们提供最优质的文档

实用型文档

公司消费品的人占多大比例，要求允许绝对误差不超过0.1，调查估计值的置信水平为95%，预计的回答率为65%，试问此次调查的样本量应取多少才能满足需要？

3.欲调查我校大一学生平均每月生活费支出情况，采用简单随机抽样抽出35名学生，他们每月的生活费支出平均为285元，计算得到的样本方差为73，试计算我校一年级学生平均每月生活费的支出额标准差、变异系数、置信区间(置信水平为95%)。。

4 .某县采用简单随机抽样估计粮食、棉花、大豆的播种面积，抽样单元为农户。根据以往资料其

变量的变异系数为

名称粮食棉花大豆变异系数 0.38 0.39 0.44

若要求以上各个项目的置信度为95%，相对误差不超过4%，需要抽取多少户？若用这一样本估计粮食的播种面积，其精度是多少？

五设计题

为了了解北京市民对目前北京市公共环境卫生以及绿色建设方方面的满意程度和期望程度，计划组织一次关于“北京市公共环境卫生状况的调查”，从而为绿色北京的建设提供指导性建议和意

我们提供最优质的文档

实用型文档

见，为2008年奥运会尽一份力量。

请针对这一调查目的，设计一份调查问卷。要求问卷能真正反映调查目的，并对相关部门的实际工作起到指导性的作用。同时还要充分考虑数据处理的难易程度。

习题三

一、单选题

1、分层抽样设计效应满足（）

A、deff1 B、deff1 C、deff1 D、deff1 2、分抽样的特点是（）

A、层内差异小，层间差异大 B、层间差异小，层内差异大 C、层间差异小 D、层内差异大

3、下面的表达式中错误的是（） A、

fh1 B、nhn C、Wh1 D、Nh1

4、在给定费用下估计量的方差V(yst)达到最小，或者对于给定的估计量方差V使得总费用达到最小的样本量分配称为（）

A、常数分配 B、比例分配 C、最有分配 D、奈曼分配

5、最优分配（Vopt）、比例分配（Vprop）的分层随机抽样与相同样本量的简单随机抽样（Vsrs）的精度之间的关系式为（）

A、VoptVpropVsrs B、VpropVoptVsrs C、VpropVoptVsrs D、VsrsVpropVopt 6、下面哪种样本量分配方式属于比例分配？

A、

nhnn B、hNhNnNhShchchNh1L

hShC、

nhNSnWSLhh D、hLhh nnNShhWhShh1h17、下面哪种样本量分配属于一般最优分配？

我们提供最优质的文档

实用型文档

nnnA、h B、hNhNnNhShchchNh1L

hShC、

nhNSnWSLhh D、hLhh nnNShhWhShh1h1二、多选题

1.分层抽样又被称为( )

A. 整群抽样 B. 类型抽样 C. 分类抽样 D. 系统抽样 E. 逆抽样 2.在分层随机抽样中，当存在可利用的辅助变量时，为了提高估计精度，可以采用（） A. 分层比估计 B. 联合比估计 C. 分别回归估计 D.联合回归估计 E. 分别简单估计 3.样本量在各层的分配方式有( )

A. 常数分配 B. 比例分配 C. 最优分配 D. 奈曼分配 E. 等比分配 4.分层抽样的优点有( )

A. 在调查中可以对各个子总体进行参数估计 B. 易于分工组织及逐级汇总 C. 可以提高估计量的精度 D. 实施方便 E. 保证样本更具有代表性 5.关于分层数的确定，下面说法正确的有( )

A. 层数多一些比较好 B. 层数少一些比较好 C. 层数一般以不超过6为宜 D. 层数一般以4 层为最好 E. 应该充分考虑费用和精度要求等因素来确定层数 6.下面哪种样本量分配方式属于奈曼分配? ( ) A.

NS/chnhnNSnn B. hLhh C. kLhh NhNnnNhShNhSh/chh1h1D.

WS/chnhWSnLhh E. hLhh nnWhShWhSh/chh1h17.事后分层的适用场合有( )

A. 各层的抽样框无法得到

B. 几个变量都适宜于分层，而要进行事先的多重交叉分层存在一定困难 C. 一个单位到底属于哪一层要等到样本数据收集到以后才知道 D. 总体规模太大，事先分层太费事 E. 一般场合都可以适用

三、判断题

1 分层抽样不仅能对总体指标进行推算，而且能对各层指标进行推算。 2 分层的基本原则是尽可能地扩大层内方差，缩小层间方差。

3 分层抽样的效率较简单随机抽样高，但并不意味着分层抽样的精度也比简单随机抽样高。 4 分层抽样克服了简单随机抽样可能出现极端的情况。

我们提供最优质的文档

实用型文档

5 分层抽样的样本在总体中分布比简单随机抽样均匀。 6 分层后各层要进行简单随机抽样。

7 分层抽样的主要作用是为了提高抽样调查结果的精确度，或者在一定的精确度的减少样本的单位数以节约调查费用。

8分层后总体各层的方差是不同的，为了提高估计的精度，通常的做法是在方差较大的层多抽一些样本。

9 在不同的层中每个单位的抽样费用可能是不等的。

10 在分层抽样的条件下，样本容量的确定与简单随机抽样的共同点都是取决于总体的方差。

11 多主题抽样中，不同的主题对样本量大小的要求不同。在费用允许的情况下，应尽可能地选择较大的样本量。

12 有时在抽样时无法确定抽样单位分别属于哪一层，只有在抽取样本之后才能区分。 13 比例分配指的是按各层的单元数占样本单元数的比例进行分配。 14 等容量分配时各层的样本单元数与各层的层权是相同的。 15 所谓最优分配是指给定估计量方差的条件下，使总费用最小。

16 在奈曼分配时，如果某一层单元数较多，内部差异较大，费用比较省，则对这一层的样本量要多分配一些。

17 在实际工作中如果第k层出现nk超过Nk，最优分配是对这个层进行100%的抽样。

18 在实际工作中，如果要给出估计量方差的无偏估计，则每层至少2个样本单元，层数不能超过n/2。 19 无论层的划分与样本量的分配是否合理，分层抽样总是比简单随机抽样的精度要高。 20 即使层权与实际情况相近，利用事后分层技术也难以达到提高估计精度的目的。

四填空题

1 分层抽样又称为类型抽样，它是将包含N个单位的总体分成各包含N1，N2，…，NL个单位的( )，这些( )互不重复，合起来就是整个的总体，因此N=( )。 2 分层抽样的基本原则是( ) 3 分层抽样中层权是( )，抽样比是（）。 4分层抽样中的样本均值是（），样本方差是( )。

5 分层抽样中，对总体的均值进行估计时，其抽样误差是( )，对总体的总量进行估计时，其抽样误差是( )。

6 分层抽样在对各层分配样本量时，可以采用不同的分配方法，各种方法所考虑的因素不同。最优分配时主要考虑的因素是( ) 、( )、（）。 7在实际工作中，通常分层抽样比简单随机抽样的精度要高。但如果出现不合理地划分( )或分配（）的情况，可能使分层抽样的更（）的结果发生。 8 事后分层的层权与实际情况相差很大，则不能利用其提高（）。 9 分层抽样要求在抽取样本之前（）对（）。 10 如果要给出估计量方差的无偏估计，则层数不能超过（）。

五简答题

1 何谓分层抽样？简述分层抽样的意义？

我们提供最优质的文档

实用型文档

2 试举一例说明分层抽样的抽样效率比简单随机的抽样要好。

3分层抽样的分层的原则及其意义。

4 简述分层抽样的局限性。

5 简述分层抽样中总样本量的分配方法。

6 怎样分层能提高精度？

六计算题

1 一个由N=1000个人构成的总体被划分为两层：第一层由N1400名男性组成，第二层由

N2600名女性组成。从中抽取一个样本量为n=250的样本，将样本等比例地分配给各层，使得

两层的抽样比都等于n/N=1/4。求各层的样本量分别是多少？

我们提供最优质的文档

实用型文档

2 一公司希望估计某一个月肭由于事故引起的工时损失。因工人、技术人员及行政管理人员的事故率不同，因而采用分层抽样。已知下列资料：工人技术人员行政管理人员 N1132N292 N327 2s1362s225 2s39 若样本量n=30，试用奈曼分配确定各层的样本量。

3 某工厂生产的新产品供应国内市场的300家用户，试销售滿一年后，现欲请用户对该厂的新产品进行评价。现把这些用户分成本地区、本省外地区、外省三层。现有资料如下：本地区本省外地区外省 N1154 N293 N353 S323.24 2S122.25 S23.24 C19 C225 C336 若要求估计评价成绩均值的方差V(yst)0.1，并且费用最省(假定费用为线性形式)，求样本量n在各层的分配。

我们提供最优质的文档

实用型文档

4 某林业局欲估计植树面积，该局共辖240个林场，按面积大小分为四层，用等比例抽取40个林场，取得下列资料(单位：公顷) 第一层第二层第三层第四层 N186 n114 y1i N272 n212 y2i N352 n39 N430 n45 y4i 125 155 67 96 256 97 67 42 25 92 47 310 236 220 352 105 86 27 45 59 142 190 53 52 125 43 试估计该林业局总的植树面积及95%的置信区间。

y3i 142 256 310 440 167 655 495 510 320 396 220 540 196 780 我们提供最优质的文档

实用型文档

5. 一个样本为

1000

的简单随机样本，其结果可分为三层，相应的

2yh=10.2,12.6,17.1,sh=10.82(各层相同)，s2=17.66，估计的层权是wh=0.5,0.3,0.2,已知这

些权数有误差，但误差在5%以内，最不好的情况是Wh=0.525，0.285，0.190或Wh=0.475，0.315，0.210，你认为是否需要分层？

习题四

1 所谓比率估计就是通过样本中的变量的来推断总体的比率。 2 比率估计是一种估计的方法而不是抽样的方式。

3 比率和比例是区别的在于它们的比值总是小于1或大于1。 4 在估计比率问题时，只有分子是随机变量。

5 采用比率估计的原因之一是在估计总体均值或总体总量时可以通过一个辅助变量来提高抽样效率。 6 比率估计是个有偏的估计量，只有样本比较大时其偏误可以忽略不计。

7 当辅助变量与调查变量呈现正相关关系时用比估计，呈现负相关关系时用乘积估计。 8 若研究变量对辅助变量的回归直线通过原点即研究变量与辅助变量成正比例关系，则用比估计，否则用回归估计。

9 对于分别估计要求每层的样本量都较大。

10 由于回归估计在小样本时偏倚有可能更大，因此采用比估计更保险些。 11 差值估计量与回归估计量一样都是无偏估计量。

12 不等概率抽样时，总体中某些单元比其它单元出现在样本中的机会大，就会使我们所推算的总体指标偏向于这些单元的标志值。

13 即使抽样单元是区域本身也不能直接进行抽样。

14 PPS抽样是放回的简单随机抽样，由于抽样是放回的，就使某个单元可能在样本中出现多次。 15 放回抽样与不放回抽样所得到的样本代表性有差别，在样本量一样时，放回抽样的估计精度高一

些。

16 推算总体总量时，此时若总体单元的差异较大，则进行简单随机抽样的效率比不等概率抽样要低。 17 使用不等概率抽样，其入样概率是由说明总体单元大小的辅助变量不确定的，即辅助变量确定每一个总体单元的入样概率。

18 使用不等概率抽样的必要条件是每一个总体单元都要有一个已知的辅助变量，用以确定单元的入样概率。

19 不等概率抽样可以改善估计量，提高抽样效率。

20 在PPS抽样时，若用代码法，则单元愈大被赋予的代码数就愈多，使每个单元入样的概率与单元

我们提供最优质的文档

实用型文档

大小成比例。

二填空题

1 利用比率估计提高抽样效率要求推断的变量与辅助变量之间存在( )关系。

2 样本相关系数为（），其中：sxy是（），sy是（），

sx是（）。

３用样本的比率估计总体比率，在大样本时对总体比率Ｒ的估计可用（）表示，对抽样误差的计算可用（）用表示。

４对于分层随机抽样，如果采用比率估计量，各层的样本量都比较大时可采用（），否则采用( )。

5 比率估计量优于简单估计量的条件是( )、( )。

6 当回归系数为事先给定的( )时，回归估计量是( )估计量；为样本回归系数时，则回归估计量是( )估计量。

7 分层抽样时如果采用回归估计，则当各层样本量( )时，采用( )，否则采用( )。

8 在PPS抽样中每个单元有说明其大小或规模的的度量Mi，则可取Zi等于（）。 9 严格的PS抽样实施起来非常复杂，在实际工作中可以通过分层，在每层中进行严格的（）的PS抽样。

10 不等概率抽样主要用于总体单元差异非常大，而推算目标量是（）的情形。

三简答题

1 简述比率估计提高抽样效率的条件。

2 简述比率估计的应用条件。

3 从等概率抽样与不等概率的区别来分析进行简单抽样的有效性。

4 简述不等概率抽样的主要优点。

5 试举一个利用区域可以直接进行抽样的例子。

我们提供最优质的文档

实用型文档

6.分析PPS抽样与PS的抽样效率。

7.回归估计、比估计与简单估计间的区别；

8.辅助变量的选择原则；

9.回归系数的选择与确定。

四计算题

1 某单位欲估计今年第一季度职工的医疗费支出，但这一费用要等到合同医院送来帐单才能知道，因此从1000个工人中随机抽取了100人作调查，这100人的总支出为1750元，若已知去年同期这100个工人的费用支出是1200元，全单位去年第一季度总支出为12500元。若根据样本计算

yi11002i316500，x15620，xiyi22059.35，试用比率估计的方法估计该单位第一

2ii1i1100100季度平均每人医药费支出的95%的置信区间。

我们提供最优质的文档

实用型文档

2.一家大公司欲估计上一季度每个工人的平均病假天数。该厂共有8个车间，人数分别为1200人，450人，2100人，860人，2840人，1910人，290 人，3200人。现拟抽取三个车间作样本，若采用与车间工人数成比例抽样，抽中第三个车间2100人，病假为4320天；第六车间1910人，病假共4160天；第八车间3200人，病假共5790天，试估计全工厂的平均每人病假天数，以及全工厂因工人病假而损失的人日数。

3. 某县欲调查某种农作物的产量，由于平原和山区的产量有差别，故拟划分平原和山区两层采用分层抽样。同时当年产量与去年产量之间有相关关系，故还计划采用比估计方法。已知平原共有120个村，去年总产量为24500（百斤），山区共有180个村，去年总产为21200（百斤）。现从平原用简单随机抽样抽取6个村，从山区抽取9个村，两年的产量资料如下：平原山区

我们提供最优质的文档

实用型文档

样本 1 2 3 4 5 6 去年产量（百斤） 204 143 82 256 275 198 当年产量（百斤） 210 160 75 280 300 190 样本 1 2 3 4 5 6 7 8 9 去年产量（百斤） 137 189 119 63 103 107 159 63 87 当年产量（百斤） 150 200 125 60 110 100 180 75 90

试用分别比估计与联合比估计分别估计当年的总产量，给出估计量的标准误差，并对上述两种结果进行比较和分析。

习题五

一、单选题

1．整群抽样中的群的划分标准为（）。

A.群的划分尽可能使群间的差异小，群内的差异大 B.群的划分尽可能使群间的差异大，群内的差异小 C.群的划分尽可能使群间的差异大，群内的差异大 D.群的划分尽可能使群间的差异小，群内的差异小 2．整群抽样的一个主要特点是( )。

A.方便 B.经济

C.可以使用简单的抽样框 D.特定场合中具有较高的精度 3．群规模大小相等时，总体均值Y的简单估计量为（）。

ˆ1A.YnMyi1j1nMij

我们提供最优质的文档

实用型文档

ˆB.YnM1yij nM1i1j1ˆ1nMC.Yyij

ni1j1ˆ1D.YNyi1j1nMij

4．群规模大小相等时，关于总体方差S的说法正确的是（）。 A.总体方差的一个无偏估计为：

ˆS

2M122[(N1)SbN(M1)S]

NM1M22[(N1)SbN(M1)S]

NM1122[(N1)SbN(M1)S]

N(M1)B.总体方差的一个无偏估计为：

ˆSˆS2C.总体方差的一个无偏估计为：

2D.总体方差的一个无偏估计为：

ˆS2122[(N1)SbN(M1)S]

NM15.下面关于群内相关系数的取值说法错误的是（）。 A.若群内次级或基本单元变得值都相等则 B.若群内方差与总体方差相等，则 C.若群内方差大于总体方差时，则 D.若

2S0，此时P取最大值1

PPc0，此时表示分群是完全随机的

取负值

cSb0时，Pc达到极小值，此时Pc1

M16.整群抽样中，对比例估计说法正确的是（）。 A.群规模相等时，总体比例P的估计可以为：

1n pAi

ni1B.群规模不等时，总体比例P的估计可以为： p(A)/(Mi1ii1nni)

C.群规模相等时，总体比例P的方差估计为：

我们提供最优质的文档

实用型文档

n21 v(p) (p)Pin(n1)i1D.群规模不等时，总体比例P的方差估计为：

v(p)1nM2•(AipMi)i1n2n1

二、多选题

1.下面关于整群抽样的说法，有哪些是正确的？（） A.通常情况下抽样误差比较大

B.整群抽样可以看作为多阶段抽样的特殊情形，即最后一阶抽样是100%的抽样 C.调查相对比较集中，实施便利，节省费用 D.整群抽样的方差约为简单随机抽样的方差的1(M1)c倍

E.为了获得同样的精度，整群抽样的样本量是简单随机抽样的1(M1)2.关于整群抽样（群规模相等）的设计效应，下面说法正确的有（） A.deffc倍

V(y)1(M1)

cVsrs(y)B.为了获得同样的精度，整群抽样的样本量是简单随机抽样的1(M1)c倍

C.群内相关系数的估计值为

ˆcs2bsbs22(M1)s2

D.要提高整群抽样估计效率，可通过增大群内单元的差异实现

E.整群抽样的精度取决于群内相关系数，群内相关系数越大，则估计量的精度越高 3.关于群规模不等时，可以采用的估计量形式有（）。

1n1nMiA.yy(y/Mi)

ni1ini1j1ij1nB.yni1nyMynzMni0ii1iii

C.ˆYyRi1ni1

iMˆˆY1nD.Y yiM0Mni1我们提供最优质的文档

实用型文档

1nE.yy

ni1i4.关于群规模大小不等时，下列说法正确的是（）。 A.若

Mi相差不多，则一般以平均群大小M代替M，依照群规模相差较大，可将群按大小分层，使每一层内群的规模

Mii大小相等的情形处理

B.如果

MiM大小基本相等，从而仍

可使用群规模

Mi大小相等时的处理方法

C.对群仍用简单随机抽样，采用简单估计的形式 D.对群仍用简单随机抽样，采用比例估计的形式 E.对群仍用简单随机抽样，采用加权估计的形式

三判断题

1 整群抽样对中选的群中的所有总体单元进行调查。

2 构造群的抽样框同构造简单随机抽样的抽样框一样都很容易。 3 在总体单元分布较广的情形下，进行简单随机抽样可以节省费用。 4 在群是以行政单位划分时，将有助于调查的实施。 5 整群抽样的抽样单元不一定基本单元的集合。

6 如果群内的差异较大，群内各单位的分布与总体分布一致，那么任意抽出一个群来进行观察就可以对总体进行准确的推断。

7 整群抽样抽取样本效率同简单随机抽样一样高。 8 整群抽样时可以在抽样前知道调查总体的样本量。

9 若群内各单元之间的差异较大这时进行整群抽样的效率就会较高。

10 为提高抽样效率，应使群内的方差尽可能地小，从而使群间方差尽可能地大。

11 进行整群抽样的目的就是节约人力、物力。而为了达到规定的精度要求，往往需要多抽一些群。 12 整群抽样有构造抽样框相对简单，样本量相对集中、调查费用节约的特点。 13 在整群抽样中，比率估计可以有效地提高抽样的估计精度。

14 以家庭户为整群抽样的抽样单元，并不能很好地做到群间结构的相近，使群间方差较小。 15 可以这样看，整群抽样适应于总体的抽样单元差异较大的情形，而分层抽样则适应于抽样单元具有趋同性的总体。

16 考虑划分群，就是考虑在相同调查费用时，抽样误差最小的情形。 17 在群的规模相等时，对总体的估计量是无偏估计量。

18 当各群的规模差异很大，并且总体估计量与群的规模高度相关时，估计量的偏差会很大。 19在群的规模不等时，对总体的估计量是有偏的估计量。

20 对于自然形成的群，无法通过调整群内单元而控制，这时要提高抽样效率就只能增大样本量。

四、填空题

1 整群抽样的抽样比是( ), 其中n为( )，N为( )。

2 整群抽样时样本的群间方差为( ),均值估计量的方差为( )，总量估计量的方差为( )

我们提供最优质的文档

实用型文档

3 整群抽样的估计精度与( )有关，当群内相关系数为( )时，其抽样效率( )简单随机抽样。

4 对自然形成的群，无法人为地控制( )，因此，要控制抽样误差，就只好控制( )。

5 整群抽样时总体参数的无偏估计适用条件是( )，( )。

6 在群规模不等的整群抽样中，把( )作为抽取样本的辅助信息，其目的是( )。

7 比率估计是( )的估计，当( )其抽样效率高于( )。

8 比例是( )的一个特例，即均值等于( )，其中yi的取值为 ( )和( )。

9 群与群之间的结构( )，就意味着( )，这时群内相关系数为 ( )。

五、简答题

1 简述整群抽样的分群原则。

2 您如何认识影响整群抽样抽样误差的主要因素是群间方差？

3 整群抽样时，采用无偏估计的方法与比率估计的方法来估计总体总量有何不同？

4 简述整群抽样的优点。

5整群抽样时，比率估计的方法估计总体总量与比估计量中的辅助变量有什么不同？

我们提供最优质的文档

实用型文档

6 简述使用整群抽样的原因。

7.整群抽样与分层抽样的区别；

8.整群抽样群大小的计量方法；

9. 整群抽样的设计效应。

六计算题

1.在某城市一次对居民小区的食品消费量的调查中，以楼层为群进行进行整群抽样，每个楼层有8家住户。用简单随机抽样在全部N=600个楼层中抽取n=12个楼层，其户人均月食品消费额(按楼层计算)如下：

我们提供最优质的文档

实用型文档

i 1 2 3 4 5 6 7 8 9 10 11 12 yi 188.00 180.50 149.75 207.875 244.25 278.50 182.75 211.50 253.125 191.125 274.75 258.375 si 27.19 17.98 17.32 29.17 45.20 63.87 38.77 27.48 44.52 28.29 43.70 43.52

要求： (1) 试估计该次调查中居民小区的人均食品消费额的95%的置信区间。 (2 )对居民小区的食品消费总额进行区间估计。

(3 )若规定允许误差不超过10000，应抽多少群来估计小区的食品消费总额？

2已知某运输公司在抽样检查所使用的车辆中安全轮胎所占的比例，在200辆车中抽了30辆，其资料如下：安全轮胎数汽车数 f aixf MifM Mi3fM2 Miai ai2x2f 我们提供最优质的文档

实用型文档

xi 0 1 2 3 4 合计 4 3 8 9 6 30 0 3 16 27 24 70 30*4=120 16*30=480 4*0 4*3 4*16 4*27 4*24 0 1*3 4*8 9*9 16*6 4*70=280 212 要求： (1) 估计该运输公司的汽车安全轮胎的比例及其估计量的方差。 (2) 以95%的把握对安全轮胎的比例作出区间估计。

习题六

我们提供最优质的文档

实用型文档

一判断题

1 系统抽样中最简单也是最常用的规则是等间隔抽取，所以又称系统抽样为等距抽样。

2 第一个样本抽取后，其它所有的样本就都确定了，这种抽样看来似乎很机械，所以系统抽样又被称为机械抽样。

3 在直线等距抽样中，总体容量是样本容量的整数倍。 4 循环等距抽样中总体单元数同样也是n的整数倍。

5 总体单元按有关标志排队就是指各单元的排列顺序与所研究的内容无关，但与总体单元的规模大小有关。

6 如果系统抽样时总体单元的排列有周期性的变化，就可能抽出代表性很差的样本。 7如果按总体单元的有关标志排列，则系统抽样时样本单元在总体中分布较均匀。 8 系统抽样可以看成是分层抽样的一个特例，但样本单元在各层的位置相同。 9 系统抽样可以看成整群抽样的一个特例，从k群中随机抽取1个群的整群抽样。 10 当N=nk时有k个可能样本，其样本均值是总体均值的无偏估计量。

11 当Nnk时采用直线等距抽样得到k个可能样本，其样本均值是总体均值的无偏估计量。 12当Nnk时采用循环等距抽样得到k个可能样本，其样本均值是总体均值的有偏估计量。 13 有效地应用系统抽样，必须了解总体的特征。

14 按无关标志排列的总体单元可以看成是随机排列的，当为有限总体时其系统抽样方差与简单随机抽样的方差相等。

15 当总体单元有趋势顺序排列时，其方差估计有一些近似的公式，不论n为何值，都可用合并层和连续差的方法来估计总体方差。

16 中心位置抽样法起始单元的抽选是在第一段的k个单元中在(1---k)之间随机抽取。 17 Sethi的方法和Singn的方法在抽取样本单元时起始单元有两个，因此这就被称为对称系统抽样。 18 对称系统抽样与一般系统抽样的主要区别在于此时起始单元不是一个而是两个，它们的位置对称，数值大小相低，因而改进了估计量的精度。

19 交叉子样本的方法又称为随机组法，它是解决周期性波动总体的系统抽样的有效方法之一。 20 当系统抽样的间隔恰好与循环周期的整数倍相一致时，系统抽样的误差将会很大。

二填空题

1系统抽样时总体单元的排序有两种方法：一是( )排列，二是按与调查标志 ( )的特征进行排列。

2 系统抽样的抽样误差与总体单元的( )有关。

3 在一般情况下，系统抽样使样本单元在总体中的分布较为( )。

4 使用对称系统抽样的方法其目的是通过改变样本的(抽选方法)以消除由于( )引起的系统偏差。

5 对称等距抽样当n为( )时，应( )一个单位：( )。

6在循环等距抽样时，抽样间距k( )整数，随机起点在( )中抽取。

7 当总体单元的排列发生聚集现象时，( )的简单随机抽样精度( )系统抽样的精度。

8 当N=555，k=20在直线等距抽样时可能的样本量是( )，可能的样本配合是( )。

9 N=555，k=20在循环等距抽样时可能的样本量是( )，可能的样本配合是( )，若随机起点为503，则首先抽出的前5个样本单元的总体编号是(

10 在直线等距系统抽样时当N=nk时，样本均值是总体均值 ( )估计量，当Nnk样本

我们提供最优质的文档

实用型文档

均值是总体均值的( )估计量。

三简答题

1 简述系统抽样的主要优点。

2系统抽样的局限性有哪些？

3 对于周期性波动的总体上在组织系统抽样的时候应注意什么问题？

4 对线性趋势的总体进行系统抽样时应该如何组织？

5 试举一个总体单元按无关标志排列进行直线等距抽样的例子。

6 简要分析影响系统抽样误差的因素。

四计算题

1 .一周期波动的总体N=240，原准备抽取一个系统样本n=24，现为消除因变动带来的影响，改为抽3个容量为8的样本，即ns=3，原来的间隔k=240/24=10，现在的k=nsk=3×10=30，假设样本的数据如下：样本i 观察值合计均值我们提供最优质的文档

实用型文档

1 2 3 17 15 19 18 21 21 15 17 15 19 16 18 20 18 17 23 22 16 15 20 21 23 20 17 143 146 154 17.875 18.25 19.25 要求：试以95%的把握估计总体的均值和总体的总量。

2 下面是美国1900年以来每隔5年的离婚率资料：年份 1900 1905 1910 1915 1920 1925 1930 1935 1940 离婚率% 0.7 0.8 0.9 1.0 1.6 1.5 1.6 1.7 2.0 年份 1945 1950 1955 1960 1965 1970 1975 1980 离婚率% 3.5 2.6 2.3 2.2 2.5 3.5 4.8 5.2 要求：

(1) 根据以上资料估计1900—1980年的平均离婚率。

(2) 根据这一资料讨论用系统抽样好还是简单随机抽样好？

六、设计题

某公司下有10个分公司，N=10，每个分公司的人数Mi见下表。现在欲考察分公司的日常办

我们提供最优质的文档

实用型文档

公费用状况，采用PS系统抽样方法抽取n=3个分公司，试回答如何进行抽取？按照你的方法，入样的分公司编号为多少？

分公司编号 1 2 3 4 5

人数Mi 103 432 96 246 84 分公司编号 6 7 8 9 10 人数Mi 73 205 168 146 317 我们提供最优质的文档

实用型文档

习题七

一、单选题

ˆ的均值可以表示为（）1. 两阶（段）抽样中，对于一个估计量。

ˆ)E[E(ˆ)] A.E(12ˆ)E[E(ˆ)] B.E(211ˆ)E(ˆ)] [E1(22ˆ)1[E(ˆ)E(ˆ)] D. E(122ˆ)C. E(

2. 关于多阶段抽样的阶段数，下列说法最恰当的是（）。

A.越多越好 B.越少越好

C.权衡各种因素决定 D.根据主观经验判断

3. 在初级单元大小相等的分层二阶段抽样中，关于自加权的说法错误的是（）。 A.自加权在这里是指在每层抽样中，每个次级单元被抽中的概率皆相等或是等价的 B.每一层总的抽样比fh为常数 C.自加权估计量一般计算比较简单 D.分层二阶段抽样自加权的条件为：

nhNhf0(h1,2,,L)

mhMh4. 在多阶段抽样中，当初级单元大小相等时，第一阶段抽样通常采用（）。

A.系统抽样 B.简单随机抽样 C.不等概率抽样 D.非概率抽样

5.初级单元大小不等的多阶段抽样中，无偏估计量成为自加权的条件是（）。 A.第一阶段每个单元被抽中的概率相等 B.第二阶段每个单元被抽中的概率相等 C.最终阶段每个单元被抽中的概率相等 D.最终阶段每个单元被抽中的概率不等

6.在初级单元大小相等的二阶段抽样中，当抽取次级单元的数量相等时，二阶段抽样的方差与整群抽样方差以及分层抽样方差之间的关系通常为（）。

A.二阶段抽样的方差＜整群抽样的方差＜分层抽样的方差 B. 二阶段抽样的方差＞整群抽样的方差＞分层抽样的方差 C. 分层抽样的方差＜二阶段抽样的方差＜整群抽样的方差

我们提供最优质的文档

实用型文档

D. 分层抽样的方差＞二阶段抽样的方差＞整群抽样的方差二、多选题

1.二阶段抽样中，初级单元大小不等时，一般可采用下面方法（）。

A.通过分层，将大小近似的初级单元分到一层，然后采用分层二阶段抽样 B.可按初级单元大小相等的方法处理

C.考虑用不等概率的抽样方法抽取初级单元

D.采用简单随机抽样抽取初级单元但改变估计量的形式 E.近似看成初级单元大小相等

2.确定样本量时需要考虑的因素有（）。 A.调查的费用 B.调查要求的精度 C.调查的时间 D.调查的技术 E.调查的目的

3.初级单元大小不等时，下面关于二阶段抽样总体总和Y的估计的说法正确的有（）。

A.可以采用放回的抽样方式，按不等概率抽取初级单元，此时可得总体总和Y 的估计量

ˆ1nMy1nYˆYHHiii ni1zini1ziB.采用不放回抽样方式，按简单随机抽样抽取初级单元，此时有

ˆNYunNMyiini1nYˆ

ii1nC. 采用不放回抽样方式，按简单随机抽样抽取初级单元，此时

ˆMYR0Yˆi1ni1ni

iMnnˆMiyiYˆD. 采用不放回抽样方式，按不等概率抽样，此时有YHTi

i1ii1iE.可以采用放回的抽样方式，按简单随机抽样抽取初级单元，此时有

ˆNYnMi1niyi

3. 在二阶段抽样中，对比例的估计通常采用（）。 A.两阶段均采用等概率抽样，用比率估计的方法 B.第一阶段采用PPS抽样，第二阶段采用等概抽样 C.两阶段均采用简单随机抽样，用简单估计的方法 D.两阶段均采用PPS抽样

E.第一阶段采用等概抽样，第二阶段采用等概抽样 5.多阶段抽样相对于简单随机抽样的优点有（）。

我们提供最优质的文档

实用型文档

A.实施方便

B.每个基本单元的调查费用比较低 C.能够充分发挥抽样的效率 D.节省人力、物力 E.可以分级准备抽样框

6.二阶段抽样中，关于总体比例P的表达可以为（）

nnn1A. PY B. PN1E. PMN1Pi C. PMNi11Yi D. PMi1Ai1i

A

ii1n五、设计题

某学校欲调查学生每月的零用钱数量。假设该学校共有18个班级，每个班级都有60个学生。请你设计一个调查方案，并说明你是如何确定样本量的。

我们提供最优质的文档

因篇幅问题不能全部显示，请点此查看更多更全内容

查看全文

全部栏目

【通用】抽样技术习题.doc