《【精品】2022届二轮复习专题五第1讲统计与统计案例学案.docx》由会员分享,可在线阅读,更多相关《【精品】2022届二轮复习专题五第1讲统计与统计案例学案.docx(16页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、专题五统计与概率高频考点梳理三年考题统计命题角度再思考L统计与统计案 例(2019 全国 II,理 5) (2019 全国 H, 理13)(2019 全国HI,理 3) (2019 全国HI, 理17)(2020 全国 I ,理 5) (2020 全国 II, 理18)(2020 全国III,理 3) (2020 全国III, 理18)(2021全国甲,理2) (2021全国甲, 理17)(2021全国乙,理17)1 .样本数字特征的计算公式及影响 因素2 .用样本平均数估计总体平均数3 .频率的估计值4 .频率分布直方图的性质及平均数 的估计值5 .根据散点图选择函数模型6 .计算相关系数及
2、抽样方法的选择7 .计算样本的方差或标准差8 .频率分布表的性质及独立性检验 的应用9 .用平均数作决策分析2.概率(2019全国【,理6) (2019全国I , 理15)(2019 全国 II,理 18) (2020 全国I ,理 19)(2021全国甲,理10) (2021全国乙,理8)1 .求古典概型的概率2 .求独立事件的概率及对立事件的 概率应用3 .用频率估计概率4 .求几何概型的概率3.随机变量的分 布列(2019 全国 I ,理 21)1 .求随机变量的分布列2 .概率与数列的综合应用第1讲统计与统计案例区必备知识精要梳理1.样本数据 汨的数字特征11 n(1)样本平均数5=一
3、(为+及+X3 +%尸一 即;nni=l(2)样本方差:s2=m(X-又)2+(q-又/ +(X友)2= ? (%/-%)2=+ 好 + 指+*-/);(3)样本平均数、方差的性质:假设即应/的平均数为元方差为那么ax +b,ax2+/?, ,axn+b 的平均数为戒+A,方差为a2s2.一注意方差的性质2 .频率分布直方图(1)小长方形的面积等于频率,各小长方形的面积的总和等于1;(2)最高的小长方形底边中点的横坐标即是众数;(3)中位数左边和右边的小长方形的面积和是相等的;(2020全国I ,理5)某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:C) 的关系,在20个不同的温
4、度条件下进行种子发芽实验,由实验数据(刈)(,=12,20)得到下面 的散点图:由此散点图,在10 至40 之间,下面四个回归方程类型中最适宜作为发芽率y和温度 x的回归方程类型的是().y-abxB.y=a-bx2C.y=a+bxD.y=a+bn x突破点三独立性检验例5(2021全国甲,理17)甲、乙两台机床生产同种产品,产品按质量分为一级品和二级 品,为了比拟两台机床产品的质量,分别用两台机床各生产了 200件产品产品的质量情况统计 如下表:产品质 量一级 品二级 品合 计甲机床1505020()乙机床12080200合计270130400甲机床、乙机床生产的产品中一级品的频率分别是多少
5、?能否有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异?2 n(ad-bc) (a+b)(c+d)(a+c)(b+dy尸(烂2公)().05()().01()0.001ko3.8416.63510.828规律方法有关独立”检验的问题解题步骤:(1)作出2x2列联表;(2)计算随机变量心的 值;(3)查临界值,检验作答对点练5(2020山东/9)为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研, 随机抽查了 100天空气中的PM2.5和SO2浓度(单位:|ig/m3),得下表:PM2.5SO20,50(50,150(150,4750,3532184(35,756812(
6、75,1153710估计事件“该市一天空气中PM2.5浓度不超过75,且SCh浓度不超过150”的概率;根据所给数据,完成下面的2x2列联表:PM2.5SO20,150(150,4750,75(75,115(3)根据中的列联表,判断是否有99%的把握认为该市一天空气中PM2.5浓度与SO2 浓度有关?附:屋二7n(ad-bc)(a+b)(c+d)(a+c)(匕+d)P(K?刁 ko)0.0500.0100.001ko3.8416.63510.828专题五统计与概率第1讲统计与统计案例关键能力学案突破【例1】解(1)根据产值增长率频数分布表得,所调查的100个企业中产值增长率 不低于40%的企业
7、频率为需=0.21 .产值负增长的企业频率为焉=0.02.用样本 频率分布估计总体分布得这类企业中产值增长率不低于40%的企业比例为21%, 产值负增长的企业比例为2%.歹=会(-0.10x2+0.10x24+0.30x53+0.50x14+0.70X7)=0.30,/=高 Z ,(守/二高(-0 1 140)2x2+(-020)2x24+02x53+0.202x14+0402x7 =0.0296,5=V0296=0.02xV74 0.17.所以,这类企业产值增长率的平均数与标准差的估计值分别为30%, 17%.【对点练l(l)c解析设中位数为x,前2组的频数之和为25,前3组的频数之和 为6
8、5,由题意可得25x40=50,解得x=23 L25.应选C.J U(2)解由得0.70=+0.20+0.15,故。=0.35./?=1-0.05-0.15-0.70=0.10.甲离子残留百分比的平均值的估计值为2x0.15+3x0.20+4x0.30+5x0.20+6x0.10+7x0.05=4.05.乙离子残留百分比的平均值的估计值为3x0.05 +4x0.10+5x0.15 +6x0.35 +7x0.20+8x0.15 =6.00.【例2】(l)C (2)C 解析该地农户家庭年收入低于4.5万元的农户比率估计 为(0.02+0.04)义 1=0.06=6%,A 正确;该地农户家庭年收入不
9、低于10.5万元的农户比率估计为 (0.04+0.02+0.02+0.02)x1 =0.1 = 10%,B 正确;该地农户家庭年收入的平均值为0.02x3+0.04x4+0.1x5+0.14x6+0.2x7+0.2x8+0.1x9+0.1x10+0.04x11+0.02x12+0 .02x13+0.02x14=7.68,0 不正确;该地农户家庭年收入介于4.5万元至8.5万元之间的比率为(0.1 +0.14+0.2+0.2)xl =0.64=64%,D 正确.(2)对于A,3校人数为200x34%=68,。校人数为200x20%=40,因为 6840xL5=60,所以 A 正确;对于B/校前1
10、00名的人数为29+25=5450,所以B正确;对于C4校在51100名的学生有25人C校在1200名的学生有40人, 也有可能在51100名的学生有25人,所以C不一定正确;对于D,A校在1100名和151200名的学生共有29+25 + 17=71(人),A校 在101150名的有21人校在1200名的有40人,但在101150名的不一定 有40人,而三个学校中在1100名和151200名内的人数至少有150人,所以3 校至少有15071-40=39(人)在1100名和151200名内,那么8校至多有 68-39=29(人)在101150名内,所以D正确.应选C.【对点练2】(1)B (2
11、)D 解析对于A,高三班德智体美劳各项得分依次为 9.5,9,9.5,9,8.5,所以极差为9.5-8.5 = 1,所以A错误;对于B,高三(2)班平均分为型等也坐=9.1,设高三班劳育分为那么9。9.5,高三(1)班平均数为95+5;9+95+=7.5+9.39,1,故B正确; JJ对于C,因为两班的德育分相等,所以除体育外,高三班的各项评价得分不 都高于高三(2)班对应的得分,所以C错误;对于D,两班的德育分相等,智育分相差9.5-9=0.5,体育分相差9.5-9=05美育 分相差9.59=0.5,劳育分相差最大,故D错误.应选B.(2)甲得分的极差是28-9=19,选项A错误;乙得分的中
12、位数是竺卢二16.5,选项 B错误;甲运发动得分在区间2。,30上有3个,选项C错误;甲运发动得分的平均值为0救32.*乙。=7,乙运发动得分的平均值为9+14+15+16+17+18+19+2089+14+15+16+17+18+19+208= 16,应选项D正确., mi c,名刀八4+5+6+823 2+3+5+717【例3角牛(1)% = -=9y = -=x4x2+5x3+6x5+8x7 = 109,Z%f=42+52+62+82=141, i=li=lA 4_ 空巧-4双 _ 109-4*鲁 _ 9- S %?-4%2 - 14L4x(竿)2 - T i=lA AAa=y-bx =
13、 -X竽=与故线性回归方程为y =*与 4/4/AA(2)将x=10代入y =与,得y = y -10,假设本月对每个保险客户的回访次数为10,那么本月的成功订单数约为10;A令 y = 1x-y12,解得1L778.故要使本月的成功订单数大于12,那么本月对每个保险客户的回访最少需12 次.【对点练3】解由表格知=2018,歹=1.6,5_2.(Xj-x)2 =4+1 +0+1 +4=10,i=l2(y.,y)2 =0.36+0.04+0.01 +0.09+0.16=0.66,i=l5X (X/-%)(y/-y)=2x0.6+1x0.2+0+1x03+2x0.4=2.5,i=l5Z (和秋先
14、-历2 r? r由上,有片15曰52 二加荔。9730.75,那么y与xZ(%i4) , Z (yry)#=i#=i的线性相关性很强.A 5_Z (阳-%)(%-力2 r(2)由上,有b =等=0.25,Z (和为 i=lA .a =歹b元=1.6-0.25x2 018=-502.9,那么y关于x的线性回归方程为Ay =0.25x-502.9,A当x=2 022时,y =0.25x2 022-502.9=2.6(百个),即该区域2022年足球特色学 校的个数为260个.【例4】解因为门=0.8858,废=-0.9953,所以|八|厂2|=。+0适宜作为与工X的回归方程模型.A 13-八 Z t
15、iyr13ty=-10,c =y - dt=109.94+10x0.16=l 11.54.因为。= =薪Z % 13丁U1i=lA所以y关于x的回归方程为y = 111.54-山. XA 10当 x=20 时,y=111.54嗡= 111.04-111.因此预测这种中药蕾香在生长期内的环境温度为20 c时的株高为111cm.【对点练4】D 解析结合题中散点图,由图象的大致走向判断,此函数应该是对数 函数模型,故应该选用的函数模型为y=a+bwc.【例5】解(1)由表格数据得甲机床生产的产品中一级品的频率为黑=*乙机床ZUU 4生产的产品中一级品的频率为端=|.(2)由题意K2的观测值2,_ n
16、(ad-bc)(a+b)(c+d)(a+c)(b+d)400x(150x80-120x50)2 1八一 二 年 ”3 切0.2566.635. 200x200x270x130所以有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异.【对点练5】解(1)根据抽查数据,该市100天空气中PM2.5浓度不超过75,且SO2 浓度不超过150的天数为32+18+6+8=64,因此,该市一天空气中PM2.5浓度不超 过75,且SO2浓度不超过150的概率的估计值为盖=0.64.根据抽查数据,可得2x2列联表:PM2.5SO20,150(150,4750,75J6416(75,1151010(3)根
17、据(2)的列联表得K2的观测值100x(64xl0-16xl0)280x20x74x26由于7.4846.635,故有99%的把握认为该市一天空气中PM2.5浓度与SO2 浓度有关.(4)平均数等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标 之和.3 ,变量间的相关关系(1)如果散点图中的点从整体上看大致分布在一条直线的附近,那么我们说变量x和y具 有线性相关关系.(2)线性回归方程:假设变量与y具有线性相关关系,有n个样本数据,那么回 AA7171AA A E (&)(%-力2 xiyrnxy AA归方程为 y = bx+a,其中 b =鼻-=rfa =y - bx.t
18、(修与S xj-nxi=li=l相关系数片n 2 xtyrnxyE,当r0时,表示两个变量正相关;当r0时,表示两个5=in o _2)(t 几歹)i=l变量负相关I越接近1,说明两个变量相关性越强;当仍接近。时,说明两个变量几乎不存在相 关性.A名师点析1.线性回归方程中,决定正相关还是负相关的是获|邮2 .回归直线一定过样本点的中心(五歹).误区警示线性回归方程|ym中,系数间易误认为是相关系频4 .独立性检验对于取值分别是为足和仃及2的分类变量X和匕其样本频数列联表是:XY总计yiy2XIaba+bX2cdc+d总计a+cb+dn随机变量K2=n(ad-bc)2,(a+b)(c+d)(a
19、+c)(b+d),其中 n-a+b+c+d.名师点析K2的观测值攵越大,说明“两个分类变量有关系”的可能性越大.国关键能力学案突破突破点一用样本估计总体考向1用样本的数字特征估计总体的数字特征例1(2019全国n,文19)某行业主管部门为了解本行业中小企业的生产情况,随机调查 了 100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表.V 的 分 组1-0.20,0)10,0.20)10.20,0.40)0.40,0.60)10.60,0.80)企 业 数22453147(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;(2)求这类企业产值
20、增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中 点值为代表).(精确到0.01)附:g=8.602.题后反思在预测总体数据的平均值时,常用样本数据的平均值估计,从而做出合理的判断.(2)平均数反映了数据取值的平均水平,标准差、方差描述了 一组数据围绕平均数波动的 大小.标准差、方差越大,数据的离散程度越大,越不稳定.对点练1(1)(2021陕西西安模拟)为了解某电子产品的使用寿命,从中随机抽取了 10。件产品进行 测试,得到图示统计图,依据统计图,估计这10。件产品使用寿命的中位数为()(2)(2019全国III,理17)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将
21、 200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离 子溶液,每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算 出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:o O 5 0)5。 3 2110, o o o o Oo O 5 0)5。 3 2110, o o o o O乙离子残留百分比直方图记。为事件:“乙离子残留在体内的百分比不低于5.5%:根据直方图得到P(。的估计值 为 0.70.求乙离子残留百分比直方图中a.b的值;分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代 表).考向2统
22、计图表及其应用例2( 1)(2021全国甲,理2)为了解某地农村经济情况,对该地农户家庭年收入进行抽样调 查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:根据此频率分布直方图,下面结论中不正确的选项是()A.该地农户家庭年收入低于4.5万元的农户比率估计为6%B.该地农户家庭年收入不低于10.5万元的农户比率估计为10%C.估计该地农户家庭年收入的平均值不超过6.5万元D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间(2)(2021内蒙古赤峰二模)为贯彻落实健康第一的指导思想,切实加强学校体育工作,促进 学生积极参加体育锻炼,养成良好的锻炼习惯,提高体质健康水
23、平,某市抽调三所中学进行中 学生体育达标测试,现简称为A校、5校、。校.现对本次测试进行调查统计,得到测试成绩排 在前200名学生层次分布的饼状图、A校前200名学生的分布条形图,那么以下结论不一定正 确的是():18.48%(约 17 人)=1 22.83%(约 21 人),,127.17%(约 25 人):31.52% (约29人)A.测试成绩前200名学生中5校人数超过。校人数的1.5倍B.测试成绩前100名学生中A校人数超过一半以上C.测试成绩在51-100名学生中A校人数多于C校人数D.测试成绩在101150名学生中B校人数至多有29人误区警示对于给出的统计图表,一定要结合问题背景理
24、解图表意义,不能似懂非懂.(2)频率分布直方图中纵坐标不要误认为频率.对点练2(1)(2021宁夏银川六盘山高级中学三模)五育并举,培养德智体美劳全面开展的社会主义 建设者和接班人,某中学开展各项有益于德智体美劳全面开展的活动.如下图是该校高三 (1)、班两个班级在某次活动中的德智体美劳的评价得分对照图(得分越高,说明该项教育越 好).以下说法正确的选项是()德10体美实线:高三班的数据 虚线:高三班的数据A.高三班五项评价得分的极差为1.5B.高三班五项评价得分的平均数比高三班五项评价得分的平均数要高C.除体育外,高三(1)班的各项评价得分均高于高三班对应的得分D.各项评价得分中,这两班的体
25、育得分相差最大(2)某赛季甲、乙两名篮球运发动八场比赛得分用茎叶图表示,茎叶图中甲得分的局部数 据丧失,但甲得分的折线图完好,那么以下结论正确的选项是()93 28 6 001294 5 8 9 7 60A.甲得分的极差是11B.乙得分的中位数是18.5C.甲运发动得分有一半在区间20,30上D.甲运发动得分的平均值比乙运发动得分的平均值高突破点二 变量的相关性及回归分析考向1变量的线性回归分析例3(2021黑龙江齐齐哈尔二模)保险是指投保人根据合同约定向保险人支付保险费,保 险人对于合同约定的可能发生的事故因其发生所造成的财产损失承当赔偿责任,或者被保险 人死亡、伤残、疾病或者到达合同约定的
26、年龄、期限等条件时承当给付保险金责任的商业保 险行为.某研究机构对每个保险客户的回访次数x与本月的成功订单数y进行统计分析,得到 x与y之间具有线性相关关系及如表数据:回访次数X15(成功订单数yA A A用最小二乘法求出y关于x的线性回归方程y = bx+Q.试根据求出的线性回归方程预测:假设本月对每个保险客户的回访次数为10,那么本月的成功订单数约为多少?要使本月的成功订单数大于12,那么本月对每个保险客户的回访最少需多少次?- b 附双-nI几 2=12IX2.1X 几 =1-X b-一 y_规律方法线性回归分析问题的类型及解题方法1 .求回归直线方程:Tji 4算出元反组+*+篇KM+
27、X少2+的值;U利用公式计算回归系数3$;T1-i写出线性回归方唳源+3i2 .对变量值预测:假设回归直线方程(方程中无参数),进而预测时,可以直接将数值代入求得特定要求 下的预测值;(2)假设回归直线方程中有参数,那么根据回归直线一定经过点(五亨),求出参数值,得到回归直 线方程,进而完成预测.对点练3(2021江西赣州二模)“足球进校园”一直是热议话题,为了解某区域足球特色学校的开展 状况,社会调查小组得到如下统计数据:年份X2016201720182019202()足球特色学 校)后个1.001.401.701.902.00根据上表数据,计算y与x的相关系数八并说明y与x的线性相关性强弱
28、;(2)求y关于x的线性回归方程,并预测该区域2022年足球特色学校的个数.(注:当仍W0.25,那么认为y与x的线性相关性较弱;当0.25仍0.75,那么认为y与x的线性相 关性一般;当0.75W1,那么认为 与x的线性相关性很强)AA nnA At (阳-%)(%-?)t xiyrnxy附:回归方程为y = bx+Q,其中b =三与-=弓齐相关系数Z (工厂无)S xj-rixr=nt (阳-元)(%刃i=li=li=ln 2 Xiyrnxy i=ls xj-nx2 i=l参考数据:72.569,713.162考向2变量的非线性回归分析例4(2021辽宁丹东二模)中药蕾香产业化种植已经成为
29、某山区农民的重要产业之一,蕾 香在环境温度为1528 时生长旺盛,环境温度高于28 或低于15 时生长缓慢或停止. 蕾香的株高M单位:cm)与生长期内环境温度15+x(单位:)中的x有关,现收集了 13组蕾香生 长期内环境温度为和株高M(i=12,13)的观测数据,得到如下图的3、)散点图.1120x根据散点图判断,可以利用模型y=+Z?y或y=c+&建立y关于x的回归方程,令s=Vx,t= XX统计处理得到一些数据:Gi,M)的线性相关系数n =0.885 8,(4,%)的线性相关系数r2=-0.9951313_133*= 10.15,歹二109.94,8=3.04=0.16, 孙 13可=
30、13.94, 砂广 13亏=2. 10, s* 13十二 11.67,i=li=li=l13?13o2413/=0.21, 2 y”13歹2 =21.22.用线性相关系数说明上面的两种模型哪种适宜作为y关于 i=li=l工的回归方程,并求这种模型的回归方程,由此预测这种中药蕾香在生长期内的环境温度为20 时的株高(株高精确到1).附:对于一组数据(两四)(i=l,23其回归直线厂a+的的斜率和截距的最小二乘估计A n .2 UVi-nuv M分别为3 =耳= v-u. uj-nu i=l疑难突破非线性回归方程的求法:(1)根据原始数据作出散点图;(2)根据散点图,选择恰当的拟合函数;(3)做恰当变换,将其转化成线性函数,求线性回归方程;(4)在(3)的基础上通过相应变换,即可得非线性回归方程.特别提醒可以建立多个函数模型时,要对每个模型进行分析比拟,选择最优模型.对点练4