[最新考纲]
1.了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率分布折线图、茎叶图,体会他们各自的特点.
2.理解样本数据标准差的意义和作用,会计算数据标准差.
3.能从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释.
4.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解样本估计总体的思想.
5.会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.
知 识 梳 理
知 识 梳 理
1.频率分布直方图
(1)通常我们对总体作出的估计一般分成两种,一种是用样本的频率分布估计总体的频率分布,另一种是用样本的数字特征估计总体的数字特征. (2)在频率分布直方图中,纵轴表示
频率
,数据落在各小组内的频率用各小长方组距
形的面积表示,各小长方形的面积总和等于1.
(3)连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率分布折线图就会越来越接近于一条光滑的曲线,统计中称之为总体密度曲线,它能够更加精细的反映出总体在各个范围内取值的百分比.
(4)当样本数据较少时,用茎叶图表示数据的效果较好,它不但可以保留所有信息,而且可以随时记录,给数据的记录和表示都带来方便. 2.用样本的数字特征估计总体的数字特征 (1)众数、中位数、平均数
①众数:在一组数据中,出现次数最多的数据叫做这组数据的众数.
②中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.
③平均数:样本数据的算术平均数,即x=1
n(x1+x2+…+xn).在频率分布直方图中,中位数左边和右边的直方图的面积相等. (2)样本方差、标准差 标准差s=
1n
[x1-x2+x2-x2+…+xn-x2]. 其中xn是样本数据的第n项,n是样本容量,x是平均数.
标准差是反映总体波动大小的特征数,样本方差是标准差的平方.通常用样本方差估计总体方差,当样本容量接近总体容量时,样本方差很接近总体方差.
辨 析 感 悟
1.对频率分布直方图的认识
(1)在频率分布直方图中,小矩形的高表示频率.(×) (2)频率分布直方图中各个长方形的面积之和为1.(√) 2.对样本数字特征的认识
(3)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.(√) (4)一组数据的方差越大,说明这组数据的波动越大.(√)
(5)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.(×)
(6)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.(√) (7)在频率分布直方图中,众数左边和右边的小长方形的面积和是相等的.(×) (8)如图是某电视台综艺节目举办的挑战主持人大赛上,七位评委为某选手打出的分数的茎叶图,去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为85,1.6.(√)
(9)(2014·广州调研改编)10名工人某天生产同一零件,生产的件数分别是15,17,14,10,15,19,17,16,14,12,则这一天10名工人生产的零件的中位数是15.(√) [感悟·提升]
1.作频率分布直方图的步骤
(1)求极差;(2)确定组距和组数;(3)将数据分组;(4)列频率分布表;(5)画频率分布直方图.
2.两个防范 一是在频率分布直方图中,小矩形的高表示频率/组距,而不是频
率,如(1);
二是利用频率分布直方图求众数、中位数和平均数时,应注意三点:①最高的小长方形底边中点的横坐标即是众数;②中位数左边和右边的小长方形的面积和是相等的;③平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.
考点一 频率分布直方图的应用
【例1】 某中学高一女生共有450人,为了了解高一女生的身高情况,随机抽取部分高一女生测量身高,所得数据整理后列出频率分布表如下:
组别 145.5~149.5 149.5~153.5 153.5~157.5 157.5~161.5 161.5~165.5 165.5~169.5 合计 频数 8 6 14 10 8 m M 频率 0.16 0.12 0.28 0.20 0.16 n N (1)求出表中字母m,n,M,N所对应的数值; (2)在给出的直角坐标系中画出频率分布直方图;
(3)估计该校高一女生身高在149.5~165.5 cm范围内有多少人?
审题路线 由频率分布表可以计算出m,n,M,N的值⇒作频率分布直方图⇒利用频率分布直方图求值.
8
解 (1)由题意M=0.16=50,落在区间165.5~169.5内数据频数m=50-(8+6+14+10+8)=4,
频率为n=0.08,总频率N=1.00. (2)频率分布直方图如下图:
(3)该所学校高一女生身高在149.5~165.5 cm之间的比例为0.12+0.28+0.20+0.16=0.76,则该校高一女生在此范围内的人数为450×0.76=342(人). 规律方法 解决频率分布直方图的问题,关键在于找出图中数据之间的联系.这频率
些数据中,比较明显的有组距、,间接的有频率、小长方形的面积,合理使
组距用这些数据,再结合两个等量关系:小长方形面积=组距×
频率
=频率,小长方组距
形面积之和等于1,即频率之和等于1,就可以解决直方图的有关问题.
【训练1】 (2013·辽宁卷)某班的全体学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为:[20,40),[40,60),[60,80),[80,100]人.若低于60分的人数是15人,则该班的学生人数是( ). A.45 B.50 C.55 D.60
解析 第一、第二小组的频率分别是0.1,0.2,所以低于60分的频率是0.3,设班15
级人数为m,则m=0.3,m=50. 答案 B
考点二 茎叶图的应用
【例2】 为了比较两种治疗失眠症的药(分别称为A药,B药)的疗效,随机地选取20位患者服用A药,20位患者服用B药,这40位患者在服用一段时间后,记录他们日平均增加的睡眠时间(单位:h),试验的观测结果如下: 服用A药的20位患者日平均增加的睡眠时间: 0.6 1.2 2.7 1.5 2.8 1.8 2.2 2.3 3.2 3.5 2.5 2.6 1.2 2.7 1.5 2.9 3.0 3.1 2.3 2.4 服用B药的20位患者日平均增加的睡眠时间: 3.2 1.7 1.9 0.8 0.9 2.4 1.2 2.6 1.3 1.4
1.6 0.5 1.8 0.6 2.1 1.1 2.5 1.2 2.7 0.5
(1)分别计算两组数据的平均数,从计算结果看,哪种药的疗效更好? (2)根据两组数据完成右面茎叶图,从茎叶图看,哪种药的疗效更好? 解 (1)设A药观测数据的平均数为xA,B药观测数据的平均数为xB, 1
则xA=20(0.6+1.2+2.7+1.5+2.8+1.8+2.2+2.3+3.2+3.5+2.5+2.6+1.2+2.7+1.5+2.9+3.0+3.1+2.3+2.4)=2.3.
1
xB=20(3.2+1.7+1.9+0.8+0.9+2.4+1.2+2.6+1.3+1.4+1.6+0.5+1.8+0.6+2.1+1.1+2.5+1.2+2.7+0.5)=1.6.则xA>xB,因此A药的疗效更好. (2)由观测结果绘制如下茎叶图:
7
从茎叶图可以看出,A药疗效的试验结果有10的叶集中在茎2,3上;B药疗效的7
试验结果有10的叶集中在茎0,1上. 由上述可看出A药的疗效更好.
规律方法 茎叶图的绘制需注意:(1)“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一;(2)重复出现的数据要重复记录,不能遗漏,特别是“叶”的位置的数据.
【训练2】 (2013·重庆卷)以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分)
甲组 x 7
已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x,y的值分别为( ).
9 2 4 0 1 2 9 5 4 乙组 y 8 A.2,5 B.5,5 C.5,8 D.8,8
解析 由茎叶图及已知得x=5,又乙组数据的平均数为16.8,即9+15+10+y+18+24
=16.8,解得y=8.
5答案 C
考点三 样本的数字特征
【例3】 甲乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图.
(1)分别求出两人得分的平均数与方差;
(2)根据图和上面算得的结果,对两人的训练成绩作出评价. 解 (1)由图象可得甲、乙两人五次测试的成绩分别为 甲:10分,13分,12分,14分,16分; 乙:13分,14分,12分,12分,14分. x甲=x乙=
10+13+12+14+16
=13,
513+14+12+12+14
=13,
5
122222s2甲=[(10-13)+(13-13)+(12-13)+(14-13)+(16-13)]=4, 5122222s2=[(13-13)+(14-13)+(12-13)+(12-13)+(14-13)]=0.8. 乙
5
2
(2)由s2甲>s乙可知乙的成绩较稳定.
从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高.
规律方法 平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小.
【训练3】 将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91.
现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x表示: 则7个剩余分数的方差为 116A.9
36B.7
( ). C.36
67D.7 87+94+90+91+90+90+x+9121解析 由题意知=91,解得x=4.所以s=7[(87
71
-91)2+(94-91)2+(90-91)2+(91-91)2+(90-91)2+(94-91)2+(91-91)2]=736
(16+9+1+0+1+9+0)=7. 答案 B
1.茎叶图、频率分布表和频率分布直方图都是用来描述样本数据的分布情况的.茎叶图由所有样本数据构成,没有损失任何样本信息,可以随时记录;而频率分布表和频率分布直方图则损失了样本的一些信息,必须在完成抽样后才能制作.
2.众数、中位数、平均数的异同
(1)众数、中位数及平均数都是描述一组数据集中趋势的量,平均数是最重要的量.
(2)平均数的大小与一组数据里每个数据均有关系,任何一个数据的变动都会引起平均数的变动,而中位数和众数都不具备此性质.
(3)众数体现各数据出现的频率,当一组数据中有若干数据多次出现时,众数往往更能反映问题.
(4)中位数仅与数据的排列位置有关,中位数可能出现在所给数据中,也可能不在所给数据中,当一组数据中的个别数据变动较大时,可用中位数描述其集中趋势.
易错辨析8——统计图表识图不准致误
【典例】 从某校高三年级随机抽取一个班,对该班50名学生的高校招生体检表中的视力情况进行统计,其频率分布直方图如图所示:
若某高校A专业对视力的要求在0.9以上,则该班学生中能报A专业的人数为________.
[解析] 该班学生视力在0.9以上的频率为(1.00+0.75+0.25)×0.2=0.4,故能报A专业的人数为0.4×50=20. [答案] 20
[易错警示] 解题中易出现审题不仔细,又对所给图形没有真正理解清楚,将矩形的高误认为频率或者对“0.9以上”的含义理解有误.
[防范措施] 求解频率分布直方图中的数据问题,最容易出现的问题就是把纵轴误以为是频率导致错误.在频率分布直方图中,纵轴表示
频率
,我们用各个小矩组距
形的面积表示该段数据的频率,所以各组数据的频率等于小矩形的高对应的数据与小矩形的宽(样本数据的组距)的乘积. 【自主体验】
(2013·福建卷)某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图.已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为( ).
A.588 B.480 C.450 D.120
解析 从频率分布直方图可以看出:分数大于或等于60分的频率为(0.030+0.025+0.015+0.010)×10=0.8,故频数为600×0.8=480. 答案 B
基础巩固题组
(建议用时:40分钟)
一、选择题
1.(2012·山东卷)在某次测量中得到的A样本数据如下:82,84,84,86,86,86,88,88,88,88.若B样本数据恰好是A样本数据每个都加2后所得数据.则A,B两样本的下列数字特征对应相同的是( ). A.众数 B.平均数 C.中位数 D.标准差
解析 对样本中每个数据都加上一个非零常数时不改变样本的方差和标准差,众数、中位数、平均数都发生改变. 答案 D
2.在样本频率分布直方图中,共有11个小长方形,若中间一个小长方形的面积1
等于其他10个小长方形面积和的4,且样本容量为160,则中间一组的频数为( ).
A.32 B.0.2 C.40 D.0.25
解析 由频率分布直方图的性质,可设中间一组的频率为x,则x+4x=1,
∴x=0.2,故中间一组的频数为160×0.2=32,选A. 答案 A
3.(2014·潮州二模)有两位射击运动员在一次射击测试中各射靶10次,每次命中的环数如下:
甲 7 8 7 9 5 4 9 10 7 4 乙 9 5 7 8 7 6 8 6 7 7 则下列判断正确的是( ). A.甲射击的平均成绩比乙好 B.乙射击的平均成绩比甲好 C.甲比乙的射击成绩稳定 D.乙比甲的射击成绩稳定
解析 甲、乙的平均成绩分别为x甲=7,x乙=7,故排除A,B项;甲、乙的1222222成绩的方差分别为s2[(7-7)+(8-7)+(7-7)+(9-7)+(5-7)+(4-7)甲=101222+(9-7)2+(10-7)2+(7-7)2+(4-7)2]=4,s2[(9-7)+(5-7)+(7-7)+乙=10
2(8-7)2+(7-7)2+(6-7)2+(8-7)2+(6-7)2+(7-7)2+(7-7)2]=1.2,则s2甲>s乙,
所以乙比甲的射击成绩稳定,故选D. 答案 D 4.
(2014·临沂一模)某中学高三从甲、乙两个班中各选出7名学生参加数学竞赛,他们取得的成绩
(满分100分)的茎叶图如图,其中甲班学生成绩的众数是85,乙班学生成绩的中位数是83,则x+y的值为( ). A.7 B.8 C.9 D.10
解析 由茎叶图可知,甲班学生成绩的众数是85,所以x=5.乙班学生成绩的中位数是83,所以y=3,所以x+y=5+3=8. 答案 B
5.甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则( ).
A.甲的成绩的平均数小于乙的成绩的平均数 B.甲的成绩的中位数等于乙的成绩的中位数 C.甲的成绩的方差小于乙的成绩的方差 D.甲的成绩的极差小于乙的成绩的极差 解析 由条形统计图知:
甲射靶5次的成绩分别为:4,5,6,7,8; 乙射靶5次的成绩分别为:5,5,5,6,9; 所以x甲=
4+5+6+7+8
5
=6;
x5+5+5+6+9乙=5=6.
所以x甲=x
乙.
故A不正确.甲的成绩的中位数为6,乙的成绩的中位数为5,
故B不正确.
s2甲
=15[(4-6)2+(5-6)2+(6-6)2+(7-6)2+(8-6)2]=15×10=2,
s2122112125-6)+(5-6)2+(6-6)2+(9-6)2乙=[(5-6)+(5]=5×12=5,因为2<5,
所以s2s2甲<乙.故C正确.
甲的成绩的极差为:8-4=4, 乙的成绩的极差为:9-5=4, 故D不正确.故选C. 答案 C 二、填空题
6.在如图所示的茎叶图中,甲、乙两组数据的中位数分别是________,________.
解析 根据茎叶图所给数据,易知两组数据的中位数分别为45,46. 答案 45 46
7.(2013·湖北卷)从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示. (1)直方图中x的值为 __________;
(2)在这些用户中,用电量落在区间[100,250]内的户数为________.
解析 (1)根据频率和为1,得(0.002 4+0.003 6+0.006 0+x+0.002 4+0.001 2)×50=1,解得x=0.004 4.
(2)(0.003 6+0.004 4+0.006 0)×50×100=70. 答案 0.004 4 70
8.某人5次上班途中所花的时间(单位:分钟)分别为x,y,10,11,9.已知这组数据的平均数为10,方差为2,则|x-y|的值为________.
解析 由题意可得:x+y=20,(x-10)2+(y-10)2=8,设x=10+t,y=10-t,|x-y|=2|t|=4. 答案 4 三、解答题
9.某校高一某班的某次数学测试成绩(满分为100分)的茎叶图和频率分布直方图都受了不同程度的破坏,但可见部分如图,据此解答下列问题:
(1)求分数在[50,60]的频率及全班人数;
(2)求分数在[80,90]之间的频数,并计算频率分布直方图中[80,90]间的矩形的高. 解 (1)分数在[50,60]的频率为0.008×10=0.08.
2
由茎叶图知,分数在[50,60]之间的频数为2,所以全班人数为0.08=25. (2)分数在[80,90]之间的频数为25-2-7-10-2=4,频率分布直方图中[80,90]4
间的矩形的高为25÷10=0.016.
10.(2014·大连模拟)从某校高三年级800名男生中随机抽取50名学生测量其身高,据测量,被测学生的身高全部在155 cm到195 cm之间.将测量结果按如下方式分成8组:第一组[155,160),第二组[160,165),…,第八组[190,195],下图是按上述分组得到的频率分布直方图的一部分.已知第一组与第八组的人数相同,第七组与第六组的人数差恰好为第八组与第七组的人数差.
求下列频率分布表中所标字母的值,并补充完成频率分布直方图. 频率分布表:
分组 … [180,185) [185,190) … 频数 … x m … 频率 … y n … 频率/组距 … z p … 解 由频率分布直方图可知前五组的频率和是(0.008+0.016+0.04+0.04+0.06)×5=0.82,第八组的频率是0.008×5=0.04,所以第六、七组的频率和是1-0.82-0.04=0.14,所以第八组的人数为50×0.04=2,第六、七组的总人数为50×0.14=7.
由已知得x+m=7,m-x=2-m, 解得x=4,m=3,
所以y=0.08,n=0.06,z=0.016,p=0.012. 补充完成频率分布直方图如图所示.
能力提升题组 (建议用时:25分钟)
一、选择题
1.(2014·长春调研)如图是依据某城市年龄在20岁到45岁的居民上网情况调查而绘制的频率分布直方图,现已知年龄在[30,35),[35,40)、[40,45]的上网人数呈现递减的等差数列分布,则年龄在[35,40)的网民出现的频率为( ).
A.0.04 B.0.06 C.0.2 D.0.3
解析 由频率分布直方图可知,年龄在[20,25)的频率为0.01×5=0.05,[25,30)的频率为0.07×5=0.35,又年龄在[30,35),[35,40),[40,45]的频率成等差数列分布,所以年龄在[35,40)的网民出现的频率为0.2. 答案 C
2.(2012·陕西卷)从甲乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计,统计数据用茎叶图表示(如图所示).设甲乙两组数据的平均数分别为x
甲
,x乙,中位数分别为m甲,m乙,则( ).
A.x甲 解析 x甲=16(41+43+30+30+38+22+25+27+10+10+14+18+18+5+345 6+8)=16, 1 x乙=16(42+43+48+31+32+34+34+38+20+22+23+23+27+10+12+45718)=16. ∴x甲 又∵m甲=20,m乙=29, ∴m甲 解析 不妨设x1≤x2≤x3≤x4,由中位数及平均数均为2,得x1+x4=x2+x3=4,故这四个数只可能为1,1,3,3或1,2,2,3或2,2,2,2,由标准差为1可得这四个数只能为1,1,3,3. 答案 1,1,3,3 三、解答题 4.(2014·西安模拟)某校从参加高三模拟考试的学生中随机抽取60名学生,将其数学成绩(均为整数)分成六组[90,100),[100,110),…,[140,150]后得到如下部分频率分布直方图.观察图形的信息,回答下列问题: (1)求分数在[120,130)内的频率; (2)若在同一组数据中,将该组区间的中点值(如:组区间[100,110)的中点值为100+110 =105.)作为这组数据的平均分,据此,估计本次考试的平均分; 2(3)用分层抽样的方法在分数段为[110,130)的学生中抽取一个容量为6的样本,将该样本看成一个总体,从中任取2人,求至多有1人在分数段[120,130)内的概率. 解 (1)分数在[120,130)内的频率为 1-(0.1+0.15+0.15+0.25+0.05)=1-0.7=0.3. (2)估计平均分为 x=95×0.1+105×0.15+115×0.15+125×0.3+135×0.25+145×0.05=121. (3)由题意,[110,120)分数段的人数为60×0.15=9(人). [120,130)分数段的人数为60×0.3=18(人). ∵用分层抽样的方法在分数段为[110,130)的学生中抽取一个容量为6的样本,∴需在[110,120)分数段内抽取2人,并分别记为m,n; 在[120,130)分数段内抽取4人,并分别记为a,b,c,d;设“从样本中任取2人,至多有1人在分数段[120,130)内”为事件A,则基本事件共有(m,n),(m,a),…,(m,d),(n,a),…,(n,d),(a,b),…,(c,d)共15种. 则事件A包含的基本事件有(m,n),(m,a),(m,b),(m,c),(m,d),(n,a),(n,b),(n,c),(n,d)共9种. 93∴P(A)=15=5. 因篇幅问题不能全部显示,请点此查看更多更全内容