《高三数学第九章统计、统计案例(三)讲义.pdf》由会员分享,可在线阅读,更多相关《高三数学第九章统计、统计案例(三)讲义.pdf(22页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第 九 章 统 计、统计案例第一节随机抽样内容要求考题举例考向规律1 .理解随机抽样的必要性和重要性2.会用简单随机抽样方法从总体中抽取样本3.了解分层抽样和系统抽样方法2 0 1 7 江苏高考T式分层抽样)2 0 1 5湖南高考 系 统 抽 样)2 0 6 湖北高考工(简单随机抽样)考情分析:在抽样方法的考查中,系统抽样、分层抽样是考查的重点,题型主要以选择题和填空题为主,属于中低档题核心素养:数据分析教材回扣基础自测自主学习知识积淀 基 础 细梳理 知 识 必 备 固 根 基 1 .简单随机抽样(1)定义:般地,设一个总体含有N个个体,从中逐个丕放回地 抽 取 个 个 体 作 为 样 本
2、如 果 每次抽取时总体内的各个个体被抽到的机会都相篁,就把这种抽样方法叫做简单随机抽样。这样抽取的样本,叫做简单随机样本。(2)常用方法:抽签法和随机数法。2 .分层抽样(1)在抽样时,将总体分成互丕交区的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样。(2)分层抽样的应用范围当总体是由差异明显的几个部分组成时,往往选用分层抽样。3 .系统抽样(1)定义:当总体中的个体数较多时,可以将总体分成均衡的几部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需的样本,这种抽样方法叫做系统抽样。(2)系统抽样的步骤假设要从容
3、量为N的总体中抽取容量为的样本。先将总体的N个个体缠号;确定分段间隔攵,对编号进行金盘。当*是样本容量)是整数时,取 k=在第1 段用简单随机抽样确定第一个个体编号IQW好;按照一定的规则抽取样本。通常是将/加上间隔我得到第2个个体编号/+匕 再加攵得到第3个个体编号 1+2&,依次进行下去,直到获取整个样本。微提醒1 .随机数法编号要求:应保证各号数的位数相同,而抽签法则无限制。2 .不论哪种抽样方法,总体中的每一个个体入样的概率是相同的。3 .系统抽样是等距抽样,入样个体的编号相差;的整数倍。4.分层抽样是按比例抽样,每一层入样的个体数为该层的个体数乘以抽样比。小题微演练 小 题 演 练
4、提 知 能.一、常规题1.为了保障人民群众的身体健康,在预防新型冠状病毒期间,贵阳市市场监督管理局加强了对市场的监管力度,为了考察某工厂生产的6 0 0 个口罩是否合格,利用随机数表进行抽样测试,先将6 0 0 个口罩进行编号,编号分别为0 0 1,0 0 2,,5 9 9,6 0 0,再从中抽取6 0 个样本,如下提供随机数表的第4行到第6行:3 2 2 1 1 8 3 4 2 9 78 6 4 5 4 0 7 3 2 5 2 4 2 0 6 4 4 3 8 1 2 2 3 4 3 5 6 77 3 5 78 9 0 5 6 4 284 4 2 1 2 5 3 3 1 3 4 5 7 86
5、0 7 3 6 2 5 3 0 0 7 3 2 86 2 3 4 5 78 89 0 7 2 3 6 8 9 6 0 8 0 43 2 5 6 78 0 8 4 3 6 7 89 5 3 5 5 77 3 4 89 9 4 83 75 2 2 5 3 5 5 78 3 2 4 5 77 89 2 3 4 5若从表中第6行第6列开始向右依次读取3个数据,则得到的第5个样本编号为()A.5 78 B.3 2 4C.5 3 5 D.5 2 2解析 第6行的第6个数开始的三位数分别为80 8,4 3 6,789,5 3 5,5 77,3 4 8,9 9 4,83 7,5 2 2,符合条件的编号分别为4
6、 3 6,5 3 5,5 77,3 4 8,5 2 2,,第5个样本数据为5 2 2。答 案D2.利用简单随机抽样从含有8个个体的总体中抽取个容量为4的样本,则总体中每个个体被抽到的概率是()A-2 B-3CiD164解析 总体个数为N,样本容量为M,则每一个个体被抽到的概率为尸=%=*=;。答 案A3.某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件。为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取6 0件进行检验,则应从丙种型号的产品中抽取件。解析 丙种型号的产品在所有产品中所占比例为2 0 0+4();鲁0 0+oo=所以应从丙种型号的产品
7、中3柚取60 X m=18(件)。答 案18二、易错题4.(忽视各种抽样的等可能性)某校要从高一、高二、高三共2 019名学生中选取5 0名组成志愿团,若先用简单随机抽样的方法从2 019名学生中剔除19名,再从剩下的2 000名学生中按分层抽样的方法抽取50名,则每名学生入选的可能性()A.都相等且 为 熊 B.都相等且为古C.不完全相等 D.均不相等解析 根据简单随机抽样及分层抽样的定义可得,每个个体被抽到的概率都相等,所以每个个体被抽到的概,率都等于2 1 9。答 案A5.(忽视系统抽样中可以先剔除部分个体)某学校为了解高一年级1 203名学生对某项教改试验的意见,打算从中抽取一个容量为
8、4 0的样本,若采用系统抽样,则分段间隔为 o解析 因为1 203除以4()不是整数,所以需随机剔除3个个体,从而每一段有30个个体,则分段间隔为30o答 案3()考点例析对点微练互动课堂考向探究考 点 一 简单随机抽样自主练习I.下列抽样方法是简单随机抽样的是()A.从50个零件中一次性抽取5个做质量检验B.从5 0个零件中有放回地抽取5个做质量检验C.从实数集中随意抽取10个数分析奇偶性D.运动员从8个跑道中随机地抽取一个跑道解 析 简单随机抽样的特点:总体有限,逐个抽取,不放回抽样,等可能,选D。答 案D2.用简单随机抽样的方法从含有10个个体的总体中,抽取一个容量为3的样本,其 中 某
9、 一 个 体 第次被抽到”的可能性与“第二次被抽到”的可能性分别是()1 J_ 3 1A,To*lo To*5C&D&J 5,io i(r io解析 解法一:在抽样过程中,个体a每一次被抽中的概率是相等的,因为总体容量为1 0,故个体“第一次被抽到”的可能性与“第二次被抽到”的可能性均为七。故选A。解法二:第一次被抽到,显然为古:第二次被抽到,首先第一次不能被抽到,第二次抽才被抽到。可能9 1 I性为历乂=而。故选A。答 案A3.有一批计算机,其编号分别为001,002,003,,1 1 2,为了调查计算机的质量问题,打算抽取4台入样。现在利用随机数表法抽样,在随机数表中选第10行第6个数“0
10、”作为开始,向右读,那么抽取的第4台计算机的编号为()附:随机数表中第1012行如下。5 3797 0762 6942 9274 39955198 1068 5019 2644 6072 0213 9207 76638173 2561 6405 8587 7663 1700 5002 5930 5455 37()7814A.072 B.021C.077 D.058解析 结合所给部分随机数表以及读法规则即知,依次可得到需要的编号分别是076,068,072,021。故抽取的第4台计算机的编号为021。答 案B练后感悟I .一个抽样试验能否用抽签法,关键看两点:一是制签是否方便;二是号签是否易搅匀
11、。一般地,当总体容量和样本容量都较小时可用抽签法。2.随机数表中共随机出现0 1,2,,9十个数字,也就是说,在表中的每个位置上出现各个数字的机会都是相等的。在使用随机数表时,如遇到三位数或四位数时,可从选择的随机数表中的某行某列的数字计起,每三个或每四个作为一个单位,自左向右选取,有超过总体号码或出现重复号码的数字舍去。考点二系统抽样【例I】(1)为了解1 003名学生的学习情况,采用系统抽样的方法,从中抽取容量为4 0的样本,则分段的间隔为()A.50 B.40 C.25 D.2()解析 先用简单随机抽样,剔除3名学生,再用系统抽样抽取样本。由系统抽样的定义知,分段间隔 为=2 5。故选C
12、。答 案C(2)某学校为了解1000名新生的身体素质,将这些学生编号为1,2,,1 0 0 0,从这些新生中用系统抽样方法等距抽取100名学生进行体质测验。若4 6号学生被抽到,则下面4名学生中被抽到的是()A.8号学生 B.200号学生C.616号学生 D.815号学生解析 由系统抽样可知第一组学生的编号为11 0,第二组学生的编号为112 0,,最后一组学生的编号为9911 00()。设第一组取到的学生编号为了,则第二组取到的学生编号为犬+1 0,以此类推,所取的学生编号为10的倍数加X。因为4 6号学生被抽到,所以x=6,所以616号学生被抽到。故选C。答 案C总结反思用系统抽样法抽取样
13、本,当g不为整数时,取左=耳,即先从总体中用简单随机抽样的方法剔除(N一欣)个个体,且剔除多余的个体不影响抽样的公平性。【变式训练】某学校采用系统抽样的方法,从该校高一年级全体800名学生中抽5 0名学生做视力检查。现将800名学生从1到800进行编号。已知从3348这16个数中抽到的数是3 9,则在第1小组116中随机抽到的数是()A.5 B.7 C.11 D.13解析 把800名学生分成50组,每组16人,各小组抽到的数构成一个公差为16的等差数列,39在第3组。所以第1组抽到的数为3932=7。故选B。答 案B考点三分层抽样 例2 (1)(多选)对下面三个事件最适宜采用的抽样方法判断正确
14、的是()从某厂生产的3 000件产品中抽取600件进行质量检验;一次数学竞赛中,某班有10人的成绩在110分以上,4 0人的成绩在90100分,10人的成绩低于90分,现在从中抽取12人的成绩了解有关情况;运动会服务人员为参加400 m决赛的6名同学安排跑道。A.适宜采用分层抽样B.适宜采用分层抽样C.适宜采用分层抽样D.适宜采用简单随机抽样解析 从某厂生产的3 000件产品中抽取600件进行质量检验,不满足分层抽样的方法;总体由差异明显且互不重叠的几部分组成,若要从中抽取12人的成绩了解有关情况,适合采用分层抽样的方法:运动会服务人员为参加400 m决赛的6名同学安排跑道,具有随机性,适合用
15、简单随机抽样。故选CD。答 案CD(2)某商场有四类食品,其中粮食类、植物油类、动物性食品类及果蔬类分别有40种,10种,3 0种,20种,现从中抽取一个容量为2 0 的样本进行食品安全检测。若采用分层抽样的方法抽取样本,则抽取的植物油类与果蔬类食品种数之和是 o解 析 抽样比为而“7 悬 不 二 菊=4 则抽取的植物油类种数是1 0 x 1=2,抽取的果蔬类食品种数是4 U *1 v I J U I N U J J2 0 x 1=4,所以抽取的植物油类与果蔬类食品种数之和是2+4=6。答 案 6(3)某中学有高中生3 (X X)人,初中生2 0 0 0 人,男、女生所占的比例如图所示,为了解
16、学生的学习情况,用分层抽样的方法从该校学生中抽取个容量为的样本,已知从高中生中抽取女生2 1 人,则从初中生中抽取的男生人数是()解析 因为分层抽样的抽取比例为2 =忐,所以初中生中抽取的男生人数是2 *噤 0 6=1 2(人)。3(MM)X 0./1UU 1UU故选A o答 案 A总结反思(I)分层抽样的操作步骤:将总体按一定标准进行分层;计算各层的个体数与总体数的比,按各层个体数占总体数的比确定各层应抽取的样本容量;在每一层进行抽样(可用简单随机抽样或系统抽样)。(2)进行分层抽样的相关计算时,常利用以下关系式巧解:一 样本容量该层抽取的个体数总体的个数口 一 该层的个体数:总体中某两层的
17、个体数之比等于样本中这两层抽取的个体数之比。【变式训练】(1)(多选)某公司生产三种型号的轿车,产量分别为1 5 0 0 辆、6 0 0 0 辆和2 0 0 0 辆,为检验该公司的产品质量,公司质监部门要抽取5 7 辆进行检验,则下列说法正确的是()A,应采用分层抽样抽取B.应采用抽签法抽取C.三种型号的轿车依次应抽取9 辆、3 6 辆、1 2 辆D.这三种型号的轿车,每辆被抽到的概率都是相等的解析 因为是三种型号的轿车,个体差异明显,所以选择分层抽样,A 正确;因为个体数目多,用抽签5 7 3法制签难,援抨不均匀,抽出的样本不具有好的代表性,B 不正确;抽样比为的4_丁短.八由=右,三种型号
18、的轿车依次应抽取9辆、3 6 辆、1 2 辆,C正确;分层抽样中,每一个个体被抽到的可能性相同,D 正确。故选A C D。答 案 A C D(2)如图,某学校共有教师1 2 0 人,现用分层抽样的方法从中选出一个3 0 人的样本,则其中被选出的青年女教师的人数为()C.4 D.3解析 青年教师的人数为1 2 0*3 0%=3 6(人),所以青年女教师为1 2 人,故青年女教师被选出的人数为3 01 2 X偏=3。故选D。答 案 D考点四抽样方法的应用 例 3 某公司有一批专业技术人员,对他们进行年龄状况和接受教育程度(学历)的调查,其结果(人数分布)如下表:学历3 5岁以下355 0岁5 0岁
19、以上本科803020研究生X20y(1)用分层抽样的方法在355 0岁年龄段的专业技术人员中抽取一个容量为5的样本,将该样本看成一个总体,从中任取2人,求至少有1人学历为研究生的概率;(2)在这个公司的专业技术人员中按年龄状况用分层抽样的方法抽取N个人,其中35岁以下4 8人,50岁以上10人,再从这N个人中随机抽取1人,此人的年龄为50岁以上的概率为号,求x,),的值。解(1)用分层抽样的方法在355 0岁年龄段的专业技术人员中抽取一个容量为5的样本,设抽取学历为本科的人数为孙 所以居=半 解得机=3。抽取的样本中有研究生2人,本科生3人,分别记作$,S2;5,Bi,心。记“至少有1人学历为
20、研究生”为事件4。从中任取2人的所有等可能基本事件共有10个:(S,8),(0,员),(Si,&),6,囱),(S2,B2),6,&),(Si,Si),(8 ,4),(B,&),(&,&)o其中至少有1人的学历为研究生的基本事件有7个:($,&),(Si,B2),(SI,&),(S2,8),(S2,&),(S2,83),(5i,82)0所以从中任取2人,至少有1人学历为研究生的概率为P(A)=jo(2)由题意,得普=,,解得N=78。所以355 0岁中被抽取的人数为7 8-4 8-1 0=2 0,所 以 砺=布?解得x=40,y=5,即x,y的值分别为40,5。总结反思(1)在解答本题时有两点
21、容易造成失分:一是通过表格分析计算抽取的人数时发生审题或计算失误。二是用列举法写出基本事件总数及事件4所含的事件数,容易漏写,使概率错误。(2)用分层抽样时,分成的各层标准要一致,互不重叠,各层抽取的比例都等于样本容量在总体中的比例,【变式训练】某初级中学共有学生2()00名,各年级男、女生人数如下表:初一年级初二年级初三年级女生373Xy男生377370Z已知在全校学生中随机抽取1名,抽到初二年级女生的概率是0.19。(1)求x的值;(2)现用分层抽样的方法在全校抽取4 8名学生,问应在初三年级抽取多少名?解(1)因为了=J 9,所以x=380。(2)初三年级人数为),+z=2 000-(3
22、73+377+380+370)=500(名),现用分层抽样的方法在全校抽取4848名学生,应在初三年级抽取的人数为标X500=12(名)。旨教师备用题 例I(配合例2使用)一个单位有职工800人,其中具有高级职称的有160人,具有中级职称的有320人,具有初级职称的有200人,其余人员有120人。为了解职工收入情况,决定按职称采用分层抽样的方法从中抽取容量为4 0的样本,则从上述各层中依次抽取的人数分别是()A.12,14,10,4 B.9,12,12,7C.8,15,12,5 D.8,16,10,6解析 由题意得,抽样比例为黑=J,所以从具有高级职称的职工中抽取的人数为160X)=8,从具o
23、wU ZU ZU有中级职称的取工中抽取的人数为3 2 0 X+=1 6,从具有初级职称的职工中抽取的人数为2 0 0 X*=1 0,从其余人员中抽取的人数为1 2 0 X 5=6,所以各层中抽取的人数依次是8,16,10.6。故选D。答 案D【例2】(配合例3使用)环保部门要对所有的新车模型进行广泛测试,以确定它的行车里程的等级,下表是对100个新车模型在一个耗油单位内行车里程(单位:千米)的测试结果。分组频数30,32)632,34)1034,36)2036,38)3038,40)IS140,42)1242,444(1)作出测试结果的频率分布直方图,并指出其中位数落在哪一组;用分层抽样的方法
24、从行车里程在区间 38,40)与 40,42)的新车模型中任取5个,并 从 这5个中随机抽取2个,求其中恰有个新车模型行车里程在 40,42)内的概率。解(1)由题意画出频率分布直方图,如图所示:频率/组距424036383432864208642 x 4;C.x i?xD.乙比甲得分稳定甲比乙得分稳定乙比甲得分稳定工“工 乙;甲比乙得分稳定解 析 因为工W2+7+8+1 6+2 2=-=1 1x乙=8+1 2+1 8+2 1+2 5-5-=1 6.8,所以工YT乙且乙比甲成绩稳定。答 案 A考点三样本的数字特征微专题微考向1:样本方差的计算【例 3】甲、乙两组各四名工人1天加工的零件数为甲:
25、2 2,1 9,2 1,1 8;乙:2 0,?,1 9,2 0。且甲、乙两组工人平均每人加工零件的个数相同,则;甲、乙两组工人加工零件数方差较大的一组的方差为。解 析 三 甲=(X(1 8+1 9+21+22)=2O,7 匕=1 X(1 9+20+20+m),由丁中=丁乙,求得机=21。甲的方差为 5l=1 x (I8-20)24-(1 9-20)2+(21-20)2+(22-20)2=2.5,乙的方差为,v l=1 X (1 9-20)2+(20-2()2+(20-20)24-(21-20)2=0.5,所以加工零件数方差较大的一组的方差为2.5。答 案 21 2.5(2)已知组数据沏,松 M
26、44,M的方差是2,则数据2X 1 20 2X 3,2X 4.2%,的标准差为。解析 由$2=京 3 工)2=2,则 数 据 况 与 加 入 为 的 方 差 为 2 2 f=4 X 2=8,标准差为2啦。/=1答 案 2啦总结反思1.样本方差的计算依据是方差的计算公式$2=%8 7)2+(田 一 7 产+一工)2。2.注意方差性质的应用:若X ,必,%的方差是p 则IT1+。,小+小,以 +。的方差是,岛 2。微考向2:用样本的数字特征估计总体【例 4】新冠肺炎疫情期间,为了减少外出聚集,“线上买菜”很受追捧。某电商平台在A地区随机抽取了 1 0 0 位居民进行调研,获得了他们每个人近七天“线
27、上买菜”的消费总金额(单位:元),整理得到如图所示的频率分布直方图。0 1 0 0 20 0 30 0 40 0 50 0 60 0 70 0 消费总金额/元(1)求利的值;(2)从“线上买菜”消费总金额不低于50 0 元的被调研居民中随机抽取2 位,求这2 位“线上买菜”消费总金额均低于60 0 元的概率:(3)若A地区有1 0 0 万居民,该平台为了促进消费,拟对消费总金额不到平均水平半的居民投放每人1 0元的电子补贴,假设每组中的数据用该组区间的中点值代替,试根据上述频率分布直方图,估计该平台在A地区拟投放的电子补贴总金额。解(1)由(0.0 0 1 1 +0.0 0 2 44-m+0.
28、0 0 2 0+0.0 0 1 0+0.0 0 0 44-0.0 0 0 1)X 1 0 0=1,得机=0.0 0 3 0 o(2)设事件M 为“这 2 位线上买菜消费总金额均低于60 0 元”,被调研的居民“线上买菜”消费总金额在 50 0,60 0)的有0.0 0 0 4X 1 0 0 X 1 0 0 =4(人),分 别 记 为 生,的,被调研的居民“线上买菜”消费总金额在 60 0,70 0 的有0.0 0()IX 1 0 0 X 1 0 0=1(人),记 为 从“线上买菜”消费总金额不低于50 0 元的被调研居民中随机抽取2 人共包含1 0 个基本事件,分别为 a h。2。3,2 4,
29、42力,。3。4,3 人,事件M 包含6 个基本事件,分别为 06,。1。3,0。4,2。3,3。4,则这2 位“线上买菜”消费总金额均低于60 0 元的概率P(M)=4=|。(3)由题意,可得A地区每位居民“线上买菜”消费总金额的平均数约为50 X 0.0 0 1 1 X 1 0 0+1 50 X 0.0 0 24X 1 0()+250 X 0.0 0 3 0 X 1 0 0 +350 X 0.0 0 2 0 X 1 0 0 +450 X 0.0 0 1 0 X 1 0 0 +550 X 0.0 0 0 4X 1 0 0 +650 X 0.0 0()1 X 1 0 0=260。低于平均水平一
30、半的频率为:竽-1 0 0:X 0.(X)2 4+0.1 1=0.1 82,所以估计该平台在A地区拟投放电子补贴总金额为1 0 0 0(X)0 X 0.1 82X 1 0=1 820 0 0 0(元)。总结反思1 .用样本估计总体时,样本的平均数、标准差只是总体的平均数、标准差的近似值,实际应用时,需先计算样本数据的平均数,分析平均水平,再计算方差(标准差)分析稳定情况。2.若给出图形,一方面可以由图形得到相应的样本数据,再计算平均数、方差(标准差);另一方面,可以从图形直观分析样本数据的分布情况,大致判断平均数的范围,并利用数据的波动性大小比较方差(标准差)的大小。【题组对点练】I.(多选)
31、某赛季甲乙两名篮球运动员各6 场比赛得分情况如下表:场次123456甲得分31162 4 3 4 189乙得分232132113510则下列说法正确的是()A.甲运动员得分的极差小于乙运动员得分的极差B.甲运动员得分的中位数小于乙运动员得分的中位数C.甲运动员得分的平均值大于乙运动员得分的平均值D.甲运动员的成绩比乙运动员的成绩稳定解析 由题意甲的极差为3 4 9=2 5,中位数是2 1,均值为2 2,方差为炉=7 5,同样乙的极差为3 5 10=2 5,中位数是2 2,均值为2 2,方差为或=8W。故选B D。答 案 B D2 .(微考向2)由于受到网络电商的冲击,某品牌的洗衣机在线下的销售
32、受到影响,造成了一定的经济损失,现将A 地区2 0 0 家实体店该品牌洗衣机的月经济损失统计如图所示。(1)求。的值;(2)求 A 地区2 0 0 家实体店该品牌洗衣机的月经济损失的众数以及中位数;(3)不经过计算,直接给出4地区2 0 0 家实体店月经济损失的平均数丁与6 0 0 0 的大小关系。解(1)依题意,(0.0 0 0 15 +0.0 0 0 2 0+0,0 0 0 0 6)X 2 0 0 0=1,解得=0.0 0 0 0 9。(2)由题图可知,A 地区2 0 0 家实体店该品牌洗衣机的月经济损失的众数为3 0 0 0,第一个小矩形的面积S=0.3,第二个小矩形的面积5 2=0 4
33、 故所求中位数在 2 0 0 0,4 0 0 0)内,故所求中八 .0.5-0 3位数为 2 0 0 0+nnnnon=3 0 0 0 oU.UW NU(3)T 6 0 0 0 oi z教师备用题【例 1】(配合例1使用)由于受到网络电商的冲击,某品牌的洗衣机在线下的销售受到影响,承受了一定的经济损失,现将A 地区2 0 0 家实体店该品牌洗衣机的月经济损失统计如图所示,估算月经济损失的平均数为w,中位数为,则m-n=。月经济损失/元解析 笫一个小矩形的面积S=0.3,第二个小矩形的面积$2=0.4,故=2 0 0 0+.;=3 0 0 0。由图U.U U U Z中数据计算可得 4=0.0 0
34、 0 0 9,而 m=I 0 0 0 X 0.3+3 0 0 0 X 0.4+5 0 0 0 X 0.18+(7 0 0 0+9 0 0 0)X 0.0 6=3 3 6 0,故?一 =3 6 0。答 案 3 6 0【例 2】(配合例4使用)党的十九大明确把精准脱贫作为决胜全面建成小康社会必须打好的三大攻坚战之一,为坚决打赢脱贫攻坚战,某帮扶单位帮助定点扶贫村脱贫。此帮扶单位为了了解某地区贫困户对其所提供的帮扶的满意度,随机调查了 4 0 个贫困户,得到贫困户的满意度评分如下:用系统抽样法从4 0个贫困户中抽取容量为8的样本,且在第一分段区间里随机抽到的评分数据为8 6。(1)请你列出抽到的8个
35、样本的评分数据;贫困户编号评分贫困户编号评分贫困户编号评分贫困户编号评分17 8118 82 17 93 19 327 3128 62 28 33 27 838 1139 52 37 23 37 549 2147 62 47 43 48 158 6158 02 59 33 58 968 5167 82 66 63 67 777 9178 82 78 03 78 188 4188 22 8S 33 87 696 3197 62 97 43 98 5108 52 08 73 08 24 07 8(2)求出所抽到的8 个样本的评分数据的均值三和方差R(3)在的条件下,若贫困户的满意度评分在(T s,
36、丁+s)之间,则满意度等级为“A级”。运用样本估计总体的思想,现从(I)中抽到的8个样本的满意度为“4级”贫困户中随机地抽取2户,求所抽到2 户的满意度评分均“超过8 5”的概率。(参考数据:6 6 Q 4.4 7,历 心 4.5 8,2 6 5.10)解(1)由题意,计算抽样间隔为4 0+8=5,且在第一分段区间里随机抽到的评分数据为8 6,它对应的序号为5,则这8个样本的评分数据依次为8 6,8 5,8 0.8 7,9 3,8 2,8 9,7 8。(2)计算所柚到的8个样本的评分数据的均值T=;X(8 6+8 5+8 0+8 7+9 3+8 2+8 9+7 8)=8 5,方 差.r=|x(
37、8 6-8 5)2+(8 5-8 5)2+(8 0-8 5)2+(8 7-8 5)24-(9 3-8 5)2+(8 2-8 5)24-(8 9-8 5)24-(7 8-8 5)2=2 1o(3)在(2)的条件下,5=4 2 4.5 8,则丁一5=8 5-4.5 8=8 0.4 2,7+$=8 9.5 8。贫困户的满意度评分在(8 0.4 2,8 9.5 8)之间的样本数据为8 6,8 5,8 7,8 2,8 9,共 5个。从这 5 个数据中随机抽取 2 个,所有可能结果有(8 6,8 5),(8 6,8 7),(8 6,8 2),(8 6,8 9),(8 5,8 7),(8 5,8 2),(8
38、 5,8 9),(8 7,8 2),(8 7,8 9),(8 2,8 9),共 10 个。所抽到2户的满意度评分均“超过8 5”的可能结果是(8 6,8 7),(8 6,8 9),(8 7,8 9),共 3 个。3故所求的概率尸=15。深度探究素养达成课外阅读增分培优几种常见的统计图表一、折线图【例 1】对甲、乙两名高三学生连续9次数学测试的成绩(单位:分)进行统计,得到如图所示的折线图,下面是关于这两名同学数学成绩的分析,正确的为。成绩/分甲 同 学乙 同 学甲同学的成绩折线图具有较好的对称性,故平均成绩为130分:根据甲同学的成绩折线图提供的数据,估计该同学的平均成绩在区间 110,120
39、内;乙同学的数学成绩与测试序号具有比较明显的线性相关性,且为正相关;乙同学在这连续9次测试中,每 次成绩均有明显进步。【思路分析】利用折线图读取甲、乙两名同学的各次测试的成绩,估算平均分,判断线性相关性及9次测验成绩的进步与下降。【解析】甲同学的成绩折线图具有较好的对称性,最高分约为130分,由图可估计,其平均成绩低于130分,故错误;根据甲同学的成绮折线图提供的数据,估计该同学的平均成绩在区间 110,120内,故正确;乙同学的数学成绮与测试序号具有比较明显的线性相关性,且为正相关,故正确;乙同学在这连续9次测试中,第4次和第7次成绩较上一次成绩有退步,故错误。综上,正确的为。【答案】【名师
40、微点】对于,可以利用平均数的定义估算9次测试成绩的平均数,即可判断其所在的区间范围。二、饼图【例2】为了解运动健身减肥的效果,某健身房调查了 2 0名肥胖者,健身之前他们的体重(单位:kg)情况如左边三维饼图(图)所示,经过四个月的健身后,他们的体重(单位:kg)情况如右边三维饼图(图)所示。对比健身前后,下面关于这2 0名 肥 胖 者 的 结 论 中 正 确 的 是。他们健身后,体重在区间 100,110)内的人数减少了 4人;这20位肥胖者健身后,他们的体重的中位数位于 90,100)内;他们健身后,原来体重在 110,120)内的肥胖者体重都至少减轻了 lOkgo【思路分析】利用两个饼图
41、所提供的数据,计算指定范围的频数及中位数,即可判断出正确的选项。【解析】对于结论,观察图,可知他们健身前与健身后,体重在区间 90,100)内的人数均占40%,故正确。对于结论,体重在区间10011()内的人数减少了50%30%=20%,20%乂20=4(人),故正确。对于结论,因为健身后体重在区间 80,90)内的人数占30%,在 90,100)内的人数占40%,故中位数位于 90,100)内,故正确。对于结论,若健身前体重在 110,120)内的肥胖者体重为110 k g,健身后体重为109 k g,依然满足两个饼图的情形,故错误。【答案】【名师微点】破解以实际生活为背景、以饼图为载体的统
42、计题的关键是会识图、读数据,即观察饼图中所划分的各个部分的数据所表示的含义,如解本题时,要从饼图中读出所划分的三个部分所占的比例。三、条形图【例3】(2020福州三检)甲、乙、丙、丁四名同学在某次军训射击测试中,各射击10次。四名同学的测试成绩对应的条形图如图所示。丙 丁以下关于四名同学射击成绩的数字特征判断不正确的是()A.平均数相同B.中位数相同C.众数不完全相同D.丁的成绩方差最大【思路分析】观察四个条形图的特征及所提供的数据,判断平均数与中位数,利用条形图中最高的小长方形所对应的横坐标判断众数,利用方差的定义比较方差的大小。【解析】甲、乙、丙、丁四名同学的平均数都为5。由题图易知,四组
43、数据的众数不完全相同,中位数相同。记甲、乙、丙、丁 成 绩 的 方 差 分 别 为 日 数5 5,5 4,则肝=(4 5)2 X 0.5 +(6 5)2乂0.5=1,0=(4-5)2X O.3+(5-5)2X O.4+(6-5)2X O.3=O.6,r f=(3-5)2X 0.3+(4-5)2X 0.l+(5-5)2X 0.2+(6-5)2X 0.1+(7-5)2X 0.3 =2.6,4=(2-5)2X 0.1 +(4-5)2X 0.3 +(5-5)2X 0.2 +(6-5)2X 0.3 +(8-5)2X 0.1=2.4,因为0.6 l 2.4 2),(X n,%)中(X,y)称为样本点的中心
44、。(3)相关系数当 co时,表明两个变量正相天;当 r 0 时,表明两个变量负相关。的绝对值越接近于1,表明两个变量的线性相关性越强。,的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系。通常历大于0.75 时,认为两个变量有很强的线性相关性。4 .独立性检验(1)分类变量:变量的不同“值”表示个体所属的不同类别,像这类变量称为分类变量。(2)列联表:列出两个分类变量的频数表,称为列联表。假设有两个分类变量X和 匕 它们的可能取值分别为(的,)和,竺,其样本频数列联表(称为2 X 2 列联表)为(3)独立性检验利用随机变量K?来判断“两个分类变量有关系”的方法称为独立性检验。微提 醒A
45、 A I .求解回归方程的关键是确定回归系数a,b,应充分利用回归直线过样本点中心(x,y)o2.根据片 的值可以判断两个分类变量有关的可信程度,若 昭 越大,则两分类变量有关的把握越大。A3 .根据回归方程计算的),值,仅是一个预报值,不是真实发生的值。、小1 4演练.卜 彘”一、常规题I.两个变量的相关关系有正相关,负相关,不相关,则下列散点图从左到右分别反映的变量间的相关关系是()A.B.C.D.解析 第一个散点图中,散点图中的点是从左下角区域分布到右上角区域,则是正相关;第三个散点图中,散点图中的点是从左上角区域分布到右下角区域,则是负相关;第二个散点图中,散点图中的点的分布没有什么规
46、律,则是不相关,所以应该是。答 案 D2.某医疗机构通过抽样调查(样本容量=1 000),利用2 X 2 列联表和K2统计量研究患肺病是否与吸烟有关。计算得=4.4 5 3,经查阅临界值表知P(K 223.8 4 1)比0.05,现给出四个结论,其中正确的是()A.在 100个吸烟的人中约有9 5 个人患肺病B.若某人吸烟,那么他有9 5%的可能性患肺病C.有 9 5%的把握认 为“患肺病与吸烟有关”D.只有5%的把握认 为“患肺病与吸烟有关”解析 由已知数据可得,有 1-0.05=9 5%的把握认为“患肺病与吸烟有关 o故选C。答 案 C3 .已知x,y的取值如下表,从散点图可以看出y与 x
47、具有线性相关关系,且问归方程为),=0.9 5 x+a,则。X0134y2.24.3 4.8 6.7解析 因为回归直线必过样本点的中心(x,),),又x=2,y =4.5,代入回归方程,得a=2.6。答 案 2.6二、易错题4 .(回信方程的概念不清)(多选)设某大学的女生体重M单位:k g)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(X,M)(i=l,2,,),用最小二乘法建立的回归方程为y=0.8 5 x 8 5.7 1,则下列结论中正确的是()A.y与x具有正的线性相关关系B.回归直线过样本点的中心(.1,y)C.若该大学某女生身高增加1 c m,则其体重约增加0.8 5
48、k gD.若该大学某女生身高为17 0 c m,则可断定其体重必为5 8.7 9 k g解析 由于线性回归方程中x的系数为0.8 5,因此y与x具有正的线性相关关系,故 A正确。因为回归直线必过样本点的中心(x,y),所以B正确。由线性回归方程的意义知,某女生的身高每增加1 c m,其体重约增加0.85 kg,故 C 正确。当该大学某女生的身高为17 0 c m 时,其体重的估计值是5 8.7 9 kg,这不是确定值,因此D不正确。答 案 A B C5.(忽视回归直线方程过样本点中心)在一次考试中,5名学生的数学和物理成绩如下表(已知学生的数学和物理成绩具有线性相关关系):学生的编号i1234
49、5数学成绩X807 57 06 56 0物理成绩y7 06 66 86 46 2现已知其线性回归方程为=0.36 戈+小 则根据此线性回归方程估计数 学 得 9 0 分的同学的物理成绩为分。(四舍五入取整数)6 0+6 5+7 0+7 5+80 八一解析 x =-=7 0,y =6 2+6 4+6 6+6 8+7 0-5-=6 6,所以 6 6=0.36 X 7 0+。,得a=4 0.8,即线性回归方程为),=0.36 x+4 0.8。当=90 时,y=0.36 X 90+4 0.8=7 3.2、7 3(分)。答 案 7 3考点例析对点微练互动课堂考向探究考 点 一 相关关系的判断自主练习1.
50、(多选)观察下列各图形,其中两个变量M y具有相关关系的图是()解析 由散点图知C 中的点都分布在一条直线附近,D中的点都分布在一条曲线附近,所以C,D中的两个变量具有相关关系。答 案CD2.已知变量x和),近似满足关系式),=-0.+1,变量),与z正相关。下列结论中正确的是()A.x与y正相关,x与z负相关B.%与y正相关,x与z正相关C.x与y负相关,x与z负相关D.4与),负相关,x与z正相关解析 由),=-0.以+1,知x与),负相关,即y随x的增长而减小,又y与z正相关,所以z随.y的增大而增大,随了的减小而减小,所以Z随工的增大而减小,与Z负相关。答 案C3.如图是我国2014年