《2017-2018学年高中数学人教A版必修三教学案:第二章 第2节 第1课时 用样本的频率分布估计总体分布 .doc》由会员分享,可在线阅读,更多相关《2017-2018学年高中数学人教A版必修三教学案:第二章 第2节 第1课时 用样本的频率分布估计总体分布 .doc(15页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第1课时用样本的频率分布估计总体分布核心必知1预习教材,问题导入根据以下提纲,预习教材P65P70,回答下列问题(1)画频率分布直方图的步骤有哪些?提示:求极差决定组距与组数决定组距与组数将数据分组列频率分布表画频率分布直方图(2)频率分布直方图的纵轴表示什么?各矩形面积之和等于什么?提示:频率分布直方图的纵轴表示频率/组距,各小长方形面积之和为1.(3)频率分布折线图和总体密度曲线各指什么?提示:连接频率分布直方图中各小长方形上端的中点就得到频率分布折线图;当频率分布直方图中组数增加,组距减小,相应的频率分布折线图会越来越接近于一条光滑的曲线,称之为总体密度曲线2归纳总结,核心必记(1)用样
2、本估计总体、数据分析的基本方法用样本估计总体的两种情况()用样本的频率分布估计总体分布()用样本的数字特征估计总体的数字特征数据分析的基本方法()借助于图形分析数据的一种基本方法是用图将它们画出来,此方法可以达到两个目的,一是从数据中提取信息,二是利用图形传递信息()借助于表格分析数据的另一种方法是用紧凑的表格改变数据的排列方式,此方法是通过改变数据的构成形式,为我们提供解释数据的新方式(2)绘制频率分布直方图的步骤(3)频率分布折线图和总体密度曲线 (4)茎叶图茎叶图的制作方法(以两位数据为例):将所有两位数的十位数字作为茎,个位数字作为叶,茎相同者共用一个茎,茎按从小到大的顺序从上向下列出
3、茎叶图的优缺点在样本数据较少时,用茎叶图表示数据的效果较好它不但可以保留所有信息,而且可以随时记录,这对数据的记录和表示都能带来方便但是当样本数据较多时,茎叶图就显得不太方便,因为每一个数据都要在图中占据一个空间,如果数据很多,茎叶就会很长问题思考(1)频率分布直方图直观形象地表示了频率分布表,在频率分布直方图中是用哪些量来表示各组频率的?提示:在频率分布直方图中用每个矩形的面积表示相应组的频率,即组距频率,各组频率的和等于1,因此各小矩形的面积的和等于1.(2)茎叶图中对“叶”和“茎”有什么要求?提示:茎叶图中,“叶”是数据的最后一个数字,其前面的数字作为“茎”课前反思通过以上预习,必须掌握
4、的几个知识点:(1)绘制频率分布直方图的步骤: ;(2)频率分布折线图和总体密度曲线的制作方法: ;(3)茎叶图的制作方法: .思考频率分布表、频率分布直方图各有什么优缺点?名师指津:(1)频率分布表在数量表示上比较确切,但不够直观、形象,分析数据分布的总体态势不太方便(2)频率分布直方图能够很容易地表示大量数据,非常直观地表明分布的形状,使我们能够看到在分布表中看不清楚的数据模式但是从直方图本身得不出原始数据内容,也就是说,把数据表示成直方图后,原有的具体数据信息就被抹掉了讲一讲1美国历届总统中,就任时年纪最小的是罗斯福,他于1901年就任,当时年仅42岁;就任时年纪最大的是里根,他于198
5、1年就任,当时69岁下面按时间顺序(从1789年的华盛顿到2009年的奥巴马,共44任)给出了历届美国总统就任时的年龄:57,61,57,57,58,57,61,54,68,51,49,64,50,48,65,52,56,46,54,49,51,47,55,55,54,42,51,56,55,51,54,51,60,62,43,55,56,61,52,69,64,46,54,48将数据进行适当的分组,并画出相应的频率分布直方图和频率分布折线图尝试解答以4为组距,列表如下:频率分布直方图如图(1)所示,频率分布折线图如图(2)所示 (1)频率分布表中极差、组距、组数的关系若为整数,则组数;若不为
6、整数,则的整数部分1组数(2)确定频率分布直方图中组距和组数的注意点组距和组数的确定没有固定的标准,将数据分组时,组数力求合适,纵使数据的分布规律能较清楚地呈现出来,组数太多或太少,都会影响我们了解数据的分布情况,若样本容量不超过100,按照数据的多少常分为512组,一般样本容量越大,所分组数越多练一练1有一容量为50的样本,数据的分组及各组的数据如下:10,15),4;15,20),5;20,25),10;25,30),11;30,35),9;35,40),8;40,45,3.(1)列出样本频率分布表;(2)画出频率分布直方图及折线图解:(1)由所给的数据,不难得出以下样本的频率分布表:数据
7、段10,15)15,20)20,25)25,30)频数451011频率0.080.100.200.22数据段30,35)35,40)40,45总计频数98350频率0.180.160.061(2)频率分布直方图如图(1)所示,频率分布折线图如图(2)所示观察下面茎叶图,它的中间部分像一棵树的茎,两边部分像这棵树的茎上长出来的叶子思考怎样理解认识茎叶图?名师指津:茎叶图也是用来表示数据的一种图,它的思路是将数组中的数按位数进行比较,将高位数字作为一个主干(茎),将低位数字作为分枝(叶),列在主干的一侧,这样就可以清楚地看到每个主干后面有几个数,每个数具体是多少讲一讲2某赛季甲、乙两名篮球运动员每
8、场比赛得分情况如下:甲的得分:12,15,24,25,31,31,36,36,37,39,44,49,50;乙的得分:8,13,14,16,23,26,28,33,38,39,51.(1)画出甲、乙两名运动员得分数据的茎叶图;(2)根据茎叶图分析甲、乙两运动员的水平尝试解答(1)作出茎叶图如图所示:(2)由(1)中的茎叶图可以看出,甲运动员的得分情况是大致对称的,中位数是36;乙运动员的得分情况除一个特殊得分外,也大致对称,中位数是26.因此甲运动员的发挥比较稳定,总体得分情况比乙运动员好画茎叶图的步骤第一步,将数据分为“茎”(高位)和“叶”(低位)两部分;第二步,将表示“茎”的数字按大小顺序
9、由上到下排成一列;第三步,将各个数据的“叶”按次序写在其茎的左、右两侧练一练2甲、乙两名同学最近几次的数学考试成绩情况如下:甲的得分:95,81,75,89,71,65,76,88,94,110,107;乙的得分:83,86,93,99,88,103,98,114,98,79,101.画出两人数学成绩的茎叶图,并根据茎叶图对两人的成绩进行比较解:甲、乙两人数学成绩的茎叶图如图所示从这个茎叶图上可以看出,乙同学的得分情况是大致对称的,中位数是98分;甲同学的得分情况除一个特殊得分外,也大致对称,中位数是88分,但分数分布相对于乙来说,趋向于低分阶段因此乙同学发挥比较稳定,总体得分情况比甲同学好讲
10、一讲3从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示(1)求直方图中x的值;(2)在这些用户中,求用电量落在区间100,250)内的户数思路点拨(1)根据各小长方形的面积和为1求解(2)先求数据落在100,250)内的频率,再由频率公式求值尝试解答 (1)由频率分布直方图知200,250)小组的频率为1(0.002 40.003 60.006 00.002 40.001 2)500.22,于是x0.004 4.(2)数据落在100,250)内的频率为(0.003 60.006 00.004 4)500.7,所求户数为0.710070.频率分
11、布直方图的性质(1)每个小矩形的面积表示样本数据落在该组内的频率(2)所有小矩形的面积和等于1.(3)利用一组的频数和频率,可以求样本容量提醒:频率分布直方图中的纵轴不是频率,而是频率/组距练一练3为了了解高一年级学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小长方形的面积之比为24171593,第二小组的频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,则该校全体高一年级学生的达标率是多少?解:(1)频率分布直方图是以面积的形式反映了数据落在各小组内的频率大小的,因此
12、第二小组的频率为0.08.又因为第二小组的频率,所以样本容量150.(2)由直方图可估计该校高一年级学生的达标率为100%88%.课堂归纳感悟提升1本节课的重点是会列频率分布表,会画频率分布直方图、频率分布折线图、茎叶图,难点是理解用样本的频率分布估计总体分布的方法2本节课要重点掌握的规律方法(1)绘制频率分布直方图的步骤,见讲1.(2)绘制茎叶图的步骤及其意义,见讲2.(3)会应用频率分布直方图的意义解决问题,见讲3.3本节课的易错点将频率分布直方图中的纵轴的单位看错而致错是本节课的主要易错点,如讲3.课下能力提升(十二)学业水平达标练题组1列频率分布表、画频率分布直方图1用样本频率分布估计
13、总体频率分布的过程中,下列说法正确的是()A总体容量越大,估计越精确B总体容量越小,估计越精确C样本容量越大,估计越精确D样本容量越小,估计越精确解析:选C由用样本估计总体的性质可得2在画频率分布直方图时,某组的频数为10,样本容量为50,总体容量为600,则该组的频率是()A. B. C. D不确定解析:选A该组的频率为,故选A.3调查某校高三年级男生的身高,随机抽取40名高三男生,实测身高数据(单位: cm)如下:17116316316616616816816016816517116916716915116817016816017416516817415916715615716416918
14、0176157162161158164163163167161(1)作出频率分布表;(2)画出频率分布直方图解:(1)最低身高151 cm,最高身高180 cm,它们的差是18015129,即极差为29;确定组距为4,组数为8,列表如下:分组频数频率149.5,153.5)10.025153.5,157.5)30.075157.5,161.5)60.15161.5,165.5)90.225165.5,169.5)140.35169.5,173.5)30.075173.5,177.5)30.075177.5,181.510.025合计401(2)频率分布直方图如图所示题组2茎叶图及应用4如图是某
15、公司10个销售店某月销售某产品数量(单位:台)的茎叶图,则数据落在区间22,30)内的频率为()A0.2 B0.4 C0.5 D0.6解析:选B数据总个数n10,又落在区间22,30)内的数据个数为4,所求的频率为0.4.故选B.5对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是()A46,45,56 B46,45,53C47,45,56 D45,47,53解析:选A直接列举求解由题意知各数为12,15,20,22,23,23,31,32,34,34,38,39,45,45,45,47,47,48,48,49,50,50,51,51,5
16、4,57,59,61,67,68,中位数是46,众数是45,最大数为68,最小数为12,极差为681256.题组3频率分布直方图的应用6(2016金华高一检测)如图所示是一容量为100的样本的频率分布直方图,则由图形中的数据,样本落在15,20)内的频数为()A20 B30 C40 D50解析:选B样本数据落在15,20内的频数为10015(0.040.1)30.7某车站在春运期间为了了解旅客购票情况,随机抽样调查了100名旅客从开始在售票窗口排队到购到车票所用的时间t(以下简称为购票用时,单位为min),下面是这次调查统计分析得到的频率分布表和频率分布直方图(如图所示).分组频数频率一组0t
17、500二组5t10100.10三组10t1510四组15t200.50五组20t25300.30合计1001.00解答下列问题:(1)这次抽样的样本容量是多少?(2)在表中填写出缺失的数据并补全频率分布直方图;(3)旅客购票用时的平均数可能落在哪一组?解:(1)样本容量是100.(2)500.10所补频率分布直方图如图中的阴影部分(3)设旅客平均购票用时为t min,则有t,即15t20.所以旅客购票用时的平均数可能落在第四组能力提升综合练1将容量为100的样本数据,按由小到大排列分成8个小组,如下表所示:组号12345678频数101314141513129第3组的频率和累积频率为()A0.
18、14和0.37 B.和C0.03和0.06 D.和解析:选A由表可知,第三小组的频率为0.14,累积频率为0.37.2某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示以组距为5将数据分组成0,5),5,10),30,35),35,40时,所作的频率分布直方图是() A B C D解析:选A由分组可知C,D两项一定不对;由茎叶图可知0,5)有1人,5,10)有1人,第一、二小组频率相同,频率分布直方图中矩形的高应相同,可排除B.故选A.3为了解电视对生活的影响,一个社会调查机构就平均每天看电视的时间对某地10 000名居民进行了调查,并根据所得数据画出了样本的频率
19、分布直方图(如图),为了分析该地居民平均每天看电视的时间与年龄、学历、职业等方面的关系,要从10 000人中再用分层抽样的方法抽出100人做进一步调查,则在2.5,3)(小时)时间段内应抽出的人数是()A25 B30 C50 D75解析:选A抽出的100人中平均每天看电视的时间在2.5,3)(小时)时间段内的频率是0.50.50.25,所以这10 000人中平均每天看电视时间在2.5,3)(小时)时间段内的人数为10 0000.252 500,又抽样比为,故在2.5,3)(小时)时间段内应抽出人数为 2 50025.4某工厂对一批产品进行了抽样检测如图是根据抽样检测后的产品净重(单位:克)数据
20、绘制的频率分布直方图,其中产品净重的范围是96,106,样本数据分组为96,98),98,100),100,102),102,104),104,106,已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是()A90 B75 C60 D45解析:选A样本中产品净重小于100克的频率为(0.0500.100)20.3,频数为36,样本总数为120.样本中净重大于或等于98克并且小于104克的产品的频率为(0.1000.1500.125)20.75,样本中净重大于或等于98克并且小于104克的产品的个数为1200.7590.5为了解某校教师使用多媒体
21、进行教学的情况,采用简单随机抽样的方法,从该校200名教师中抽取20名,调查了他们上学期使用多媒体进行教学的次数,结果用茎叶图表示如图:据此可估计该校上学期200名教师中,使用多媒体进行教学次数在15,25)内的人数为_解析:在抽取的20名教师中,在15,25)内的人数为6,据此可估计该校上学期200名教师中,使用多媒体进行教学的次数在15,25)内的人数为60.答案:606在我市2016年“创建文明城市”知识竞赛中,考评组从中抽取200份试卷进行分析,其分数的频率分布直方图如图所示,则分数在区间60,70)上的人数大约有_解析:根据频率分布直方图,分数在区间60,70)上的频率为0.0410
22、0.4,分数在区间60,70)上的人数为2000.480.答案:807在某电脑杂志的一篇文章中,每个句子的字数如下:10,28,31,17,23,27,18,15,26,24,20,19,36,27,14,25,15,22,11,24,27,17在某报纸的一篇文章中,每个句子的字数如下:27,39,33,24,28,19,32,41,33,27,35,12,36,41,27,13,22,23,18,46,32,22(1)将这两组数据用茎叶图表示;(2)将这两组数据进行比较分析,你会得到什么结论?解:(1)(2)电脑杂志上每个句子的字数集中在1030之间;而报纸上每个句子的字数集中在2040之间
23、还可以看出电脑杂志上每个句子的平均字数比报纸上每个句子的平均字数要少说明电脑杂志作为科普读物更加通俗易懂、简单明了8某市2016年4月1日4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物):61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45.(1)完成频率分布表;(2)作出频率分布直方图;(3)根据国家标准,污染指数在050之间时,空气质量为优;在51100之间时,为良;在101150之间时,为轻微污染;在151200之间时,为轻度污染请你依据所给数据和上述标准,对该市的空气质量给出一个简短评价解:(1)频率分布表:分组频数频率41,51)251,61)161,71)471,81)681,91)1091,101)5101,1112(2)频率分布直方图如图所示(3)答对下述两条中的一条即可:该市一个月中空气污染指数有2天处于优的水平,占当月天数的;有26天处于良的水平,占当月天数的;处于优或良的天数为28,占当月天数的.说明该市空气质量基本良好轻微污染有2天,占当月天数的;污染指数在80以上的接近轻微污染的天数15,加上处于轻微污染的天数2,占当月天数的,超过50%.说明该市空气质量有待进一步改善