《高考数学一轮复习第9章算法初步统计与统计案例第3节统计图表数据的数字特征用样本估计总体教师用书文北师大版.doc》由会员分享,可在线阅读,更多相关《高考数学一轮复习第9章算法初步统计与统计案例第3节统计图表数据的数字特征用样本估计总体教师用书文北师大版.doc(9页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、1第三节第三节 统计图表、数据的数字特征、用样本估计总体统计图表、数据的数字特征、用样本估计总体考纲传真 1.了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.2.理解样本数据标准差的意义和作用,会计算数据标准差.3.能从样本数据中提取基本的数字特征(如平均数、标准差),并给出合理的解释.4.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征理解用样本估计总体的思想,会用样本估计总体的思想解决一些简单的实际问题1统计图表(1)条形统计图的特点:数据量很大时,能直观地反映数据分布的大致情况,且能清晰地表示出各个区间的具体数
2、(2)茎叶图表示数据有两个突出的优点:统计图上没有信息的损失,所有的原始数据都可以从这个茎叶图中得到;茎叶图可以随时记录,方便表示与比较2频率分布直方图(1)频率分布直方图:每个小矩形的宽度为 xi(分组的宽度),高为,小矩形的f i xi面积恰为相应的频率f i,我们称这样的图形为频率分布直方图(2)作频率分布直方图的步骤求极差(即一组数据中最大值与最小值的差)决定组距与组数将数据分组列频率分布表画频率分布直方图(3)频率分布折线图在频率分布直方图中,按照分组原则,再在左边和右边各加上一个区间,从所加的左边区间的中点开始,用线段依次连接频率分布直方图中各个矩形的顶端中点,直至右边所加区间的中
3、点就得到频率分布折线图3数据的数字特征(1)众数、中位数、平均数在一组数据中,出现次数较多的数据叫作这组数据的众数将一组数据按大小依次排列,把处在中间位置的一个数据(或中间两个数据的平均数)叫作这组数据的中位数2如果有n个数x1,x2,xn,那么 叫作这n个数的平均数xx1x2xn n(2)标准差和方差标准差是样本数据到平均数的一种平均距离s .1 nx1x2x2x2xnx2方差:s2 (x1 )2(x2 )2(xn )21 nxxx(xn是样本数据,n是样本容量, 是样本平均数)x1(思考辨析)判断下列结论的正误(正确的打“” ,错误的打“”)(1)平均数、众数与中位数从不同的角度描述了一组
4、数据的集中趋势( )(2)一组数据的方差越大,说明这组数据越集中. ( )(3)频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间的频率越高( )(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次( )解析 (1)正确平均数、众数与中位数都在一定程度上反映了数据的集中趋势(2)错误方差越大,这组数据越离散(3)正确小矩形的面积组距频率频率 组距(4)错误茎相同的数据,叶可不用按从小到大的顺序写,相同的数据叶要重复记录,故(4)错误答案 (1) (2) (3) (4)图 9312(教材改编)若某校高一年级 8 个班参加合唱比赛的得分如茎叶图 9
5、31 所示,则这组数据的中位数和平均数分别是( )A91.5 和 91.5 B91.5 和 92C91 和 91.5 D92 和 92A A 这组数据由小到大排列为 87,89,90,91,92,93,94,96.中位数是91.5,9192 2平均数 91.5.x8789909192939496 83(2017南昌二模)如图 932 所示是一样本的频率分布直方图若样本容量为3100,则样本数据在15,20)内的频数是( )图 932A50 B40C30 D14C C 因为15,20)对应的小矩形的面积为 10.0450.150.3,所以样本落在15,20)的频数为 0.310030,故选 C.
6、4(2016江苏高考)已知一组数据 4.7,4.8,5.1,5.4,5.5,则该组数据的方差是_0 01 1 5 个数的平均数 5.1,x4.74.85.15.45.5 5所以它们的方差s2 (4.75.1)2(4.85.1)2(5.15.1)2(5.45.1)1 52(5.55.1)20.1.5(2017山东淄博模拟)某校女子篮球队 7 名运动员身高(单位:cm)分布的茎叶图如图 933,已知记录的平均身高为 175 cm,但记录中有一名运动员身高的末位数字不清晰,如果把其末位数字记为x,那么x的值为_图 9332 2 170 (12x451011)175,1 7则 (33x)5,即 33x
7、35,解得x2.1 7样本的数字特征(1)(2015广东高考)已知样本数据x1,x2,xn的均值 5,则样本数据x2x11,2x21,2xn1 的均值为_4(2)某企业有甲、乙两个研发小组为了比较他们的研发水平,现随机抽取这两个小组往年研发新产品的结果如下:(a,b),(a, ),(a,b),( ,b),( , ),(a,b),(a,b),baab(a, ),( ,b),(a, ),( , ),(a,b),(a, ),( ,b),(a,b)其中a, 分别表bababbaa示甲组研发成功和失败;b, 分别表示乙组研发成功和失败b若某组成功研发一种新产品,则给该组记 1 分,否则记 0 分试计算甲
8、、乙两组研发新产品的成绩的平均数和方差并比较甲、乙两组的研发水平;若该企业安排甲、乙两组各自研发一种新产品,试估计恰有一组研发成功的概率.【导学号:66482437】(1)1111 由条件知 5,则所求均值0xx1x2xn nx2x112x212xn1 n2 125111.2x1x2xnn nx(2)甲组研发新产品的成绩为1,1,1,0,0,1,1,1,0,1,0,1,1,0,1,其平均数为甲 . 3 分x10 152 3方差s .2 甲1 15(12 3)2 10(02 3)2 52 9乙组研发新产品的成绩为1,0,1,1,0,1,1,0,1,0,0,1,0,1,1,其平均数为乙 .x9 1
9、53 5方差s.2 乙1 15(13 5)2 9(03 5)2 66 25因为甲乙,ss,xx2 甲2 乙所以甲组的研发水平优于乙组. 6 分记E恰有一组研发成功在所抽得的 15 个结果中,恰有一组研发成功的结果是(a, ),( ,b),(a, ),bab( ,b),(a, ),(a, ),( ,b),共 7 个abba因此事件E发生的概率为.7 15用频率估计概率,即得所求概率为P(E). 12 分7 15规律方法 1.平均数反映了数据的中心,是平均水平,而方差和标准差反映的是数据围绕平均数的波动大小进行均值与方差的计算,关键是正确运用公式. 52可以通过比较甲、乙两组样本数据的平均数和方差
10、的差异,对甲、乙两品种做出评价或选择变式训练 1 (2017郑州模拟)为比较甲、乙两地某月 14 时的气温状况,随机选取该月中的 5 天,将这 5 天中 14 时的气温数据(单位:)制成如图 934 所示的茎叶图考虑以下结论:图 934甲地该月 14 时的平均气温低于乙地该月 14 时的平均气温;甲地该月 14 时的平均气温高于乙地该月 14 时的平均气温; 甲地该月 14 时的气温的标准差小于乙地该月 14 时的气温的标准差;甲地该月 14 时的气温的标准差大于乙地该月 14 时的气温的标准差其中根据茎叶图能得到的统计结论的序号为 ( )A B C DB B 甲地 5 天的气温为:26,28
11、,29,31,31,其平均数为甲29;x2628293131 5方差为s (2629)2(2829)2(2929)2(3129)2(3129)23.6;2 甲1 5标准差为s甲.3.6乙地 5 天的气温为:28,29,30,31,32,其平均数为乙30;x2829303132 5方差为s (2830)2(2930)2(3030)2(3130)2(3230)22;2 乙1 5标准差为s乙.甲乙,s甲s乙2xx茎叶图及其应用(2014全国卷)某市为了考核甲、乙两部门的工作情况,随机访问了 50 位市民根据这 50 位市民对这两部门的评分(评分越高表明市民的评价越高),绘制茎叶图如下:6(1)分别估
12、计该市的市民对甲、乙两部门评分的中位数;(2)分别估计该市的市民对甲、乙两部门的评分高于 90 的概率;(3)根据茎叶图分析该市的市民对甲、乙两部门的评价解 (1)由所给茎叶图知,50 位市民对甲部门的评分由小到大排序,排在第 25,26位的是 75,75,故样本中位数为 75,所以该市的市民对甲部门评分的中位数的估计值是 75. 3 分50 位市民对乙部门的评分由小到大排序,排在第 25,26 位的是 66,68,故样本中位数为67,所以该市的市民对乙部门评分的中位数的估计值是 67. 5 分6668 2(2)由所给茎叶图知,50 位市民对甲、乙部门的评分高于 90 的比率分别为0.1,5
13、500.16,故该市的市民对甲、乙部门的评分高于 90 的概率的估计值分别为 0.1,0.16. 8 508 分(3)由所给茎叶图知,市民对甲部门的评分的中位数高于对乙部门的评分的中位数,而且由茎叶图可以大致看出对甲部门的评分的标准差要小于对乙部门的评分的标准差,说明该市市民对甲部门的评价较高、评价较为一致,对乙部门的评价较低、评价差异较大. 12 分规律方法 1.茎叶图的优点是保留了原始数据,便于记录及表示,能反映数据在各段上的分布情况2(1)作样本的茎叶图时,先要根据数据特点确定茎、叶,再作茎叶图;作“叶”时,要做到不重不漏,一般由内向外,从小到大排列,便于数据的处理(2)根据茎叶图中数据
14、的数字特征进行分析判断,考查识图能力、判断推理能力和创新应用意识;解题的关键是抓住“叶”的分布特征,准确提炼信息变式训练 2 (2017雅礼中学质检)已知甲、乙两组数据如茎叶图 935 所示,若7两组数据的中位数相同,平均数也相同,那么mn_.【导学号:66482438】图 9351111 两组数据的中位数相同,m3.24 2又两组数据的平均数也相同,n8,273339 320n323438 4因此mn11.频率分布直方图角度 1 利用分布直方图求频率、频数(2016山东高考)某高校调查了 200 名学生每周的自习时间(单位:小时),制成了如图 936 所示的频率分布直方图,其中自习时间的范围
15、是17.5,30,样本数据分组为17.5,20),20,22.5),22.5,25),25,27.5),27.5,30根据直方图,这 200 名学生中每周的自习时间不少于 22.5 小时的人数是( )图 936A56 B60C120 D140D D 由直方图可知每周自习时间不少于 22.5 小时的频率为(0.160.080.04)2.50.7,则每周自习时间不少于 22.5 小时的人数为 0.7200140.故选 D.角度 2 用频率分布直方图估计总体(2016四川高考)我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查通过抽样,获得了某年 100 位居民每人的月
16、均用水量(单位:吨)将数据按照0,0.5),0.5,1),4,4.5分成 9 组,制成8了如图 937 所示的频率分布直方图图 937(1)求直方图中a的值;(2)设该市有 30 万居民,估计全市居民中月均用水量不低于 3 吨的人数,说明理由;(3)估计居民月均用水量的中位数解 (1)由频率分布直方图可知,月均用水量在0,0.5)的频率为0.080.50.04,同理,在0.5,1),1.5,2),2,2.5),3,3.5),3.5,4),4,4.5组的频率分别为 0.08,0.21,0.25,0.06,0.04,0.02.由 1(0.040.080.210.250.060.040.02)0.5
17、a0.5a,解得a0.30. 5 分(2)由(1)知,该市 100 位居民中月均用水量不低于 3 吨的频率为0.060.040.020.12.由以上样本的频率分布,可以估计 30 万居民中月均用水量不低于 3 吨的人数为 300 0000.1236 000. 8 分(3)设中位数为x吨因为前 5 组的频率之和为 0.040.080.150.210.250.730.5,而前 4 组的频率之和为 0.040.080.150.210.480.5,所以 2x2.5. 10 分由 0.50(x2)0.50.48,解得x2.04.故可估计居民月均用水量的中位数为 2.04 吨. 12 分规律方法 1.准确
18、理解频率分布直方图的数据特点,频率分布直方图中纵轴上的数据是各组的频率除以组距的结果,易误认为纵轴上的数据是各组的频率2(1)例 32 中抓住频率分布直方图中各小长方形的面积之和为 1,这是解题的关键(2)利用样本的频率分布估计总体分布思想与方法1用样本估计总体是统计的基本思想9用样本频率分布来估计总体分布的重点是频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布;难点是频率分布表和频率分布直方图的理解及应用2(1)众数、中位数及平均数都是描述一组数据集中趋势的量,平均数是最重要的量,与每个样本数据有关,这是中位数、众数所不具有的性质(2)标准差、方差描述了一组数据围绕平均数波动的大
19、小标准差、方差越大,数据的离散程度就越大(3)茎叶图、频率分布表和频率分布直方图都是用图表直观描述样本数据的分布规律的易错与防范1使用茎叶图时,要弄清茎叶图的数字特点,切莫混淆茎与叶的含义2利用频率分布直方图求众数、中位数与平均数时,应注意这三者的区分:(1)最高的矩形的中点即众数;(2)中位数左边和右边的直方图的面积是相等的;(3)平均数是频率分布直方图的“重心” ,等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和3直方图与条形图不要搞混频率分布直方图的纵坐标为频率/组距,每一个小长方形的面积表示样本个体落在该区间内的频率;条形图的纵坐标为频数或频率,把直方图视为条形图是常见的错误