《数学(文)知识清单-专题16 概率与统计(考点解读)(原卷+解析版).pdf》由会员分享,可在线阅读,更多相关《数学(文)知识清单-专题16 概率与统计(考点解读)(原卷+解析版).pdf(50页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、1专题专题 16概率与统计概率与统计1以客观题形式考查抽样方法,样本的数字特征和回归分析,独立性检验的基本思路、方法及相关计算与推断2本部分较少命制大题,若在大题中考查多在概率与统计、算法框图等知识交汇处命题,重点考查抽样方法,频率分布直方图和回归分析或独立性检验,注意加强抽样后绘制频率分布直方图,然后作统计分析或求概率的综合练习3以客观题形式考查古典概型与几何概型、互斥事件与对立事件的概率计算4与统计结合在大题中考查古典概型与几何概型知识点一、统计与统计案例知识点一、统计与统计案例1.抽样方法三种抽样方法的比较类别共同点各自特点相互联系适用范围简单随机抽样抽样过程中每个个体被抽取的概率相等从
2、总体中逐个抽取总体中的个体数较少系统抽样将总体均分成几部分,按事先确定的规则在各部分抽取在起始部分抽样时采用简单随机抽样总体中的个体数较多分层抽样将总体分成几层,分层进行抽取分层抽样时采用简单随机抽样或系统抽样总体由差异明显的几部分组成2.统计图表(1)在频率分布直方图中:各小矩形的面积表示相应各组的频率,各小矩形的高频率组距;各小矩形面积之和等于 1;中位数左右两侧的直方图面积相等,因此可以估计其近似值2(2)茎叶图当数据有两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的
3、图叫做茎叶图当数据有三位有效数字,前两位相对比较集中时,常以前两位为茎,第三位(个位)为叶(其余类推)3样本的数字特征(1)众数在样本数据中,频率分布最大值所对应的样本数据(或出现次数最多的那个数据)(2)中位数样本数据中,将数据按大小排列,位于最中间的数据如果数据的个数为偶数,就取当中两个数据的平均数作为中位数(3)平均数与方差样本数据的平均数1n(x1x2xn)方差 s21n(x1)2(x2)2(xn)2注意:(1)现实中总体所包含的个体数往往较多,总体的平均数与标准差、方差是不知道(或不可求)的,所以我们通常用样本的平均数与标准差、方差来估计总体的平均数与标准差、方差(2)平均数反映了数
4、据取值的平均水平,标准差、方差描述了一组数据围绕平均数波动的大小标准差、方差越大,数据的离散程度越大,越不稳定4变量间的相关关系(1)利用散点图可以初步判断两个变量之间是否线性相关如果散点图中的点从整体上看大致分布在一条直线的附近,我们说变量 x 和 y 具有线性相关关系(2)用最小二乘法求回归直线的方程设线性回归方程为x,则.注意:回归直线一定经过样本的中心点(,),据此性质可以解决有关的计算问题5回归分析r,叫做相关系数相关系数用来衡量变量 x 与 y 之间的线性相关程度;|r|1,且|r|越接近于 1,相关程度越高,|r|越接近3于 0,相关程度越低6独立性检验假设有两个分类变量 X 和
5、 Y,它们的取值分别为x1,x2和y1,y2,其样本频数列联表(称为 22 列联表)为y1y2总计x1ababx2cdcd总计acbdabcd则 K2(abcd)(adbc)2(ab)(cd)(ac)(bd),若 K23.841,则有 95%的把握说两个事件有关;若 K26.635,则有 99%的把握说两个事件有关;若 K22.706,则没有充分理由认为两个事件有关.7.随机事件的概率随机事件的概率范围:0P(A)1;必然事件的概率为 1,不可能事件的概率为 0.8古典概型计算一次试验中基本事件的总数 n;求事件 A 包含的基本事件的个数 m;利用公式 P(A)mn计算9一般地,如果事件 A、
6、B 互斥,那么事件 AB 发生(即 A、B 中有一个发生)的概率,等于事件 A、B 分别发生的概率的和,即 P(AB)P(A)P(B)10对立事件:在每一次试验中,相互对立的事件 A 和不会同时发生,但一定有一个发生,因此有 P()1P(A)11互斥事件与对立事件的关系对立必互斥,互斥未必对立12几何概型一般地,在几何区域 D 内随机地取一点,记事件“该点落在其内部区域 d 内”为事件 A,则事件 A 发生的概率 P(A)d 的测度D 的测度.4高频考点一高频考点一几何概型几何概型例 1如图,正方形 ABCD 内的图形来自中国古代的太极图.正方形内切圆中的黑色部分和白色部分关于正方形的中心成中
7、心对称.在正方形内随机取一点,则此点取自黑色部分的概率是A14B8C12D4【变式探究】从区间0,1随机抽取 2n 个数 x1,x2,xn,y1,y2,yn,构成 n 个数对(x1,y1),(x2,y2),(xn,yn),其中两数的平方和小于 1 的数对共有 m 个,则用随机模拟的方法得到的圆周率的近似值为()A.4nmB.2nmC.4mnD.2mn高频考点二高频考点二古典概型古典概型例 2【2019 年高考全国卷文数】生物实验室有 5 只兔子,其中只有 3 只测量过某项指标,若从这 5只兔子中随机取出 3 只,则恰有 2 只测量过该指标的概率为A23B35C25D15jyfs(2018 年北
8、京卷)电影公司随机收集了电影的有关数据,经分类整理得到下表:电影类型第一类第二类第三类第四类第五类第六类电影部数14050300200800510好评率0.40.20.150.250.20.1好评率是指:一类电影中获得好评的部数与该类电影的部数的比值.5()从电影公司收集的电影中随机选取 1 部,求这部电影是获得好评的第四类电影的概率;()随机选取 1 部电影,估计这部电影没有获得好评的概率;()电影公司为增加投资回报,拟改变投资策略,这将导致不同类型电影的好评率发生变化.假设表格中只有两类电影的好评率数据发生变化,那么哪类电影的好评率增加 0.1,哪类电影的好评率减少 0.1,使得获得好评的
9、电影总部数与样本中的电影总部数的比值达到最大?(只需写出结论)【变式探究】从分别写有 1,2,3,4,5 的 5 张卡片中随机抽取 1 张,放回后再随机抽取 1 张,则抽得的第一张卡片上的数大于第二张卡片上的数的概率为()A.110B.15C.310D.25【变式探究】从分别标有1,2,9的9张卡片中不放回地随机抽取 2 次,每次抽取 1 张则抽到的 2 张卡片上的数奇偶性不同的概率是(A)518(B)49(C)59(D)79【变式探究】袋中共有 15 个除了颜色外完全相同的球,其中有 10 个白球,5 个红球从袋中任取 2 个球,所取的 2 个球中恰有 1 个白球,1 个红球的概率为()A.
10、521B.1021C.1121D1【变式探究】有 5 支彩笔(除颜色外无差别),颜色分别为红、黄、蓝、绿、紫从这 5 支彩笔中任取 2支不同颜色的彩笔,则取出的 2 支彩笔中含有红色彩笔的概率为()A.45B.35C.25D.15高频考点三高频考点三概率与其他知识的交汇概率与其他知识的交汇例 3.某超市计划按月订购一种酸奶,每天进货量相同,进货成本每瓶 4 元,售价每瓶 6 元,未售出的酸奶降价处理,以每瓶2元的价格当天全部处理完 根据往年销售经验,每天需求量与当天最高气温(单位:)有关如果最高气温不低于 25,需求量为 500 瓶;如果最高气温位于区间20,25),需求量为 300 瓶;如果
11、最高气温低于 20,需求量为 200 瓶为了确定六月份的订购计划,统计了前三年六月份各天的最高气温数据,得下面的频数分布表:最高气温10,15)15,20)20,25)25,30)30,35)35,40)天数216362574以最高气温位于各区间的频率估计最高气温位于该区间的概率6(1)估计六月份这种酸奶一天的需求量不超过 300 瓶的概率(2)设六月份一天销售这种酸奶的利润为 Y(单位:元)当六月份这种酸奶一天的进货量为 450 瓶时,写出 Y 的所有可能值,并估计 Y 大于零的概率【变式探究】某汽车美容公司为吸引顾客,推出优惠活动:对首次消费的顾客,按 200 元/次收费,并注册成为会员,
12、对会员逐次消费给予相应优惠,标准如下表:消费次数第 1 次第 2 次第 3 次第 4 次第 5 次及以上收费比例10.950.900.850.80该公司从注册的会员中,随机抽取了 100 位进行统计,得到统计数据如下表:消费次数第 1 次第 2 次第 3 次第 4 次第 5 次及以上频数60201055假设汽车美容一次,公司成本为 150 元,根据所给数据,解答下列问题:(1)估计该公司一位会员至少消费两次的概率;(2)某会员仅消费两次,求这两次消费中,公司获得的平均利润;(3)该公司要从这 100 位里至少消费两次的顾客中按消费次数用分层抽样方法抽出 8 人,再从这 8 人中抽出 2 人发放
13、纪念品,求抽出的 2 人中恰有 1 人消费两次的概率高频考点四高频考点四抽样方法抽样方法例 4.(2018 年全国 III 卷)某公司有大量客户,且不同年龄段客户对其服务的评价有较大差异为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样、分层抽样和系统抽样,则最合适的抽样方法是_【变式探究】(1)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为 200,400,300,100 件为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取 60 件进行检验,则应从丙种型号的产品中抽取_件;(2)在一次马拉松比赛中,35 名运动员的成绩(单位:分钟)的茎叶图如图所示.
14、若将运动员按成绩由好到差编为135号,再用系统抽样方法从中抽取7人,则其中成绩在区间139,151上的运动员人数是_【变式探究】某月月底,某商场想通过抽取发票存根的方法估计该月的销售总额先将该月的全部销7售发票的存根进行了编号,1,2,3,然后拟采用系统抽样的方法获取一个样本若从编号为 1,2,3,10 的前 10 张发票的存根中随机抽取 1 张,然后再按系统抽样的方法依编号顺序逐次产生第 2 张、第 3 张、第 4 张、,则抽样中产生的第 2 张已编号的发票存根,其编号不可能是()A13B17C19D23高频考点五、高频考点五、用样本估计总体用样本估计总体例 5、我国是世界上严重缺水的国家,
15、某市为了制定合理的节水方案,对居民用水情况进行了调查通过抽样,获得了某年 100 位居民每人的月均用水量(单位:吨)将数据按照0,0.5),0.5,1),4,4.5分成 9 组,制成了如图所示的频率分布直方图(1)求直方图中 a 的值;(2)设该市有 30 万居民,估计全市居民中月均用水量不低于 3 吨的人数,说明理由;(3)估计居民月均用水量的中位数【变式探究】一个样本 a,3,5,7 的平均数是 b,且 a、b 是方程 x25x40 的两根,则这个样本的方差是()A3B4C5D6高频考点六变量的相关性与统计案例例 6、(1)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了 2
16、014 年 1 月至 2016年 12 月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图8根据该折线图,下列结论错误的是()A月接待游客量逐月增加B年接待游客量逐年增加C各年的月接待游客量高峰期大致在 7,8 月D各年 1 月至 6 月的月接待游客量相对于 7 月至 12 月,波动性更小,变化比较平稳(2)为了研究某班学生的脚长 x(单位:厘米)和身高 y(单位:厘米)的关系,从该班随机抽取 10 名学生,根据测量数据的散点图可以看出 y 与 x 之间有线性相关关系设其回归直线方程为x.已知错误!i225,错误!i1 600,4.该班某学生的脚长为 24,据此估计其身高为()A160
17、B163C166D170【变式探究】已知变量 x 与 y 之间的回归直线方程为32x,若错误!i17,则错误!i的值等于()A3B4C0.4D401【2019 年高考全国卷文数】西游记 三国演义 水浒传和红楼梦是中国古典文学瑰宝,并称为中国古典小说四大名著某中学为了解本校学生阅读四大名著的情况,随机调查了 100 位学生,其中阅读过西游记或红楼梦的学生共有 90 位,阅读过红楼梦的学生共有 80 位,阅读过西游记且阅读过红楼梦的学生共有 60 位,则该校阅读过西游记的学生人数与该校学生总数比值的估计值为A0.5B0.6C0.7D0.892【2019 年高考全国卷文数】某学校为了解 1 000
18、名新生的身体素质,将这些学生编号为 1,2,1 000,从这些新生中用系统抽样方法等距抽取 100 名学生进行体质测验若 46 号学生被抽到,则下面 4 名学生中被抽到的是A8 号学生B200 号学生C616 号学生D815 号学生3【2019 年高考全国卷文数】生物实验室有 5 只兔子,其中只有 3 只测量过某项指标,若从这 5 只兔子中随机取出 3 只,则恰有 2 只测量过该指标的概率为A23B35C25D154【2019 年高考江苏卷】已知一组数据 6,7,8,8,9,10,则该组数据的方差是_5【2019 年高考全国卷文数】我国高铁发展迅速,技术先进经统计,在经停某站的高铁列车中,有
19、10 个车次的正点率为 0.97,有 20 个车次的正点率为 0.98,有 10 个车次的正点率为 0.99,则经停该站高铁列车所有车次的平均正点率的估计值为_6【2019 年高考全国卷文数】某商场为提高服务质量,随机调查了 50 名男顾客和 50 名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:满意不满意男顾客4010女顾客3020(1)分别估计男、女顾客对该商场服务满意的概率;(2)能否有 95%的把握认为男、女顾客对该商场服务的评价有差异?附:22()()()()()n adbcKab cd ac bdP(K2k)0.0500.0100.001k3.8416.63
20、510.8287【2019 年高考全国卷文数】某行业主管部门为了解本行业中小企业的生产情况,随机调查了 100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率 y 的频数分布表10y的分组0.20,0)0,0.20)0.20,0.40)0.40,0.60)0.60,0.80)企业数22453147(1)分别估计这类企业中产值增长率不低于 40%的企业比例、产值负增长的企业比例;(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表)(精确到 0.01)附:748.6028【2019 年高考全国卷文数】为了解甲、乙两种离子在小鼠体内的残留程度,进行如
21、下试验:将 200只小鼠随机分成 A,B 两组,每组 100 只,其中 A 组小鼠给服甲离子溶液,B 组小鼠给服乙离子溶液每只小鼠给服的溶液体积相同、摩尔浓度相同经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比根据试验数据分别得到如下直方图:记 C 为事件:“乙离子残留在体内的百分比不低于 5.5”,根据直方图得到 P(C)的估计值为 0.70(1)求乙离子残留百分比直方图中 a,b 的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表)9【2019 年高考天津卷文数】2019 年,我国施行个人所得税专项附加扣除办法,涉及子女教育、继续教育、大病
22、医疗、住房贷款利息或者住房租金、赡养老人等六项专项附加扣除某单位老、中、青员工分别有72,108,120人,现采用分层抽样的方法,从该单位上述员工中抽取 25 人调查专项附加扣除的享受情况(1)应从老、中、青员工中分别抽取多少人?(2)抽取的 25 人中,享受至少两项专项附加扣除的员工有 6 人,分别记为,A B C D E F享受情况如下表,其中“”表示享受,“”表示不享受现从这 6 人中随机抽取 2 人接受采访员工ABCDEF11项目子女教育继续教育大病医疗住房贷款利息住房租金赡养老人(i)试用所给字母列举出所有可能的抽取结果;(ii)设 M 为事件“抽取的 2 人享受的专项附加扣除至少有
23、一项相同”,求事件 M 发生的概率10【2019 年高考北京卷文数】改革开放以来,人们的支付方式发生了巨大转变近年来,移动支付已成为主要支付方式之一为了解某校学生上个月 A,B 两种移动支付方式的使用情况,从全校所有的 1000名学生中随机抽取了 100 人,发现样本中 A,B 两种支付方式都不使用的有 5 人,样本中仅使用 A 和仅使用 B 的学生的支付金额分布情况如下:支付金额支付方式不大于 2 000 元大于 2 000 元仅使用 A27 人3 人仅使用 B24 人1 人(1)估计该校学生中上个月 A,B 两种支付方式都使用的人数;(2)从样本仅使用 B 的学生中随机抽取 1 人,求该学
24、生上个月支付金额大于 2 000 元的概率;(3)已知上个月样本学生的支付方式在本月没有变化现从样本仅使用 B 的学生中随机抽查 1 人,发现他本月的支付金额大于 2 000 元结合(2)的结果,能否认为样本仅使用 B 的学生中本月支付金额大于2 000 元的人数有变化?说明理由1.(2018 年浙江卷)设 0p3.841,则有 95%的把握说两个事件有关;若 K26.635,则有 99%的把握说两个事件有关;若 K22.706,则没有充分理由认为两个事件有关.7.随机事件的概率随机事件的概率范围:0P(A)1;必然事件的概率为 1,不可能事件的概率为 0.8古典概型计算一次试验中基本事件的总
25、数 n;求事件 A 包含的基本事件的个数 m;利用公式 P(A)mn计算9一般地,如果事件 A、B 互斥,那么事件 AB 发生(即 A、B 中有一个发生)的概率,等于事件 A、B 分别发生的概率的和,即 P(AB)P(A)P(B)10对立事件:在每一次试验中,相互对立的事件 A 和A不会同时发生,但一定有一个发生,因此有P(A)1P(A)11互斥事件与对立事件的关系对立必互斥,互斥未必对立12几何概型一般地,在几何区域 D 内随机地取一点,记事件“该点落在其内部区域 d 内”为事件 A,则事件 A 发生22的概率 P(A)d 的测度D 的测度.高频考点一高频考点一几何概型几何概型例 1如图,正
26、方形 ABCD 内的图形来自中国古代的太极图.正方形内切圆中的黑色部分和白色部分关于正方形的中心成中心对称.在正方形内随机取一点,则此点取自黑色部分的概率是A14B8C12D4【答案】B【解析】设正方形边长为a,则圆的半径为2a,正方形的面积为2a,圆的面积为24a.由图形的对称性可知,太极图中黑白部分面积相等,即各占圆面积的一半.由几何概型概率的计算公式得,此点取自黑色部分的概率是221248aa,选 B.【变式探究】从区间0,1随机抽取 2n 个数 x1,x2,xn,y1,y2,yn,构成 n 个数对(x1,y1),(x2,y2),(xn,yn),其中两数的平方和小于 1 的数对共有 m
27、个,则用随机模拟的方法得到的圆周率的近似值为()A.4nmB.2nmC.4mnD.2mn【答案】C【解析】由题意知,mn4,故4mn,即圆周率的近似值为4mn.高频考点二高频考点二古典概型古典概型例 2【2019 年高考全国卷文数】生物实验室有 5 只兔子,其中只有 3 只测量过某项指标,若从这 523只兔子中随机取出 3 只,则恰有 2 只测量过该指标的概率为A23B35C25D15【答案】B【解析】设其中做过测试的 3 只兔子为,a b c,剩余的 2 只为,A B,则从这5只中任取3只的所有取法有,a b ca b Aa b Ba c Aa c Ba A Bb c A,,b c Bb A
28、 Bc A B,共 10 种其中恰有 2 只做过测试的取法有,a b Aa b Ba c Aa c B,b c Ab c B,共 6 种,所以恰有 2 只做过测试的概率为63105,故选 Bjyfs(2018 年北京卷)电影公司随机收集了电影的有关数据,经分类整理得到下表:电影类型第一类第二类第三类第四类第五类第六类电影部数14050300200800510好评率0.40.20.150.250.20.1好评率是指:一类电影中获得好评的部数与该类电影的部数的比值.()从电影公司收集的电影中随机选取 1 部,求这部电影是获得好评的第四类电影的概率;()随机选取 1 部电影,估计这部电影没有获得好评
29、的概率;()电影公司为增加投资回报,拟改变投资策略,这将导致不同类型电影的好评率发生变化.假设表格中只有两类电影的好评率数据发生变化,那么哪类电影的好评率增加 0.1,哪类电影的好评率减少 0.1,使得获得好评的电影总部数与样本中的电影总部数的比值达到最大?(只需写出结论)【答案】()0.025()0.814()增加第五类电影的好评率,减少第二类电影的好评率.【解析】()由题意知,样本中电影的总部数是 140+50+300+200+800+510=2000.第四类电影中获得好评的电影部数是 2000.25=50,故所求概率为 0.025()设“随机选取 1 部电影,这部电影没有获得好评”为事件
30、 B.没有获得好评的电影共有 1400.6+500.8+3000.85+2000.75+8000.8+5100.9=1628 部.24由古典概型概率公式得 0.814.()增加第五类电影的好评率,减少第二类电影的好评率.【变式探究】从分别写有 1,2,3,4,5 的 5 张卡片中随机抽取 1 张,放回后再随机抽取 1 张,则抽得的第一张卡片上的数大于第二张卡片上的数的概率为()A.110B.15C.310D.25【解析】从 5 张卡片中随机抽取 1 张,放回后再随机抽取 1 张的情况如图:基本事件总数为 25,第一张卡片上的数大于第二张卡片上的数的事件数为 10,所求概率 P102525.故选
31、 D.【答案】D【变式探究】从分别标有1,2,9的9张卡片中不放回地随机抽取 2 次,每次抽取 1 张则抽到的 2 张卡片上的数奇偶性不同的概率是(A)518(B)49(C)59(D)79【答案】C【解析】标有1,2,9的9张卡片中,标奇数的有5张,标偶数的有4张,所以抽到的 2 张卡片上的数奇偶性不同的概率是1154259 89C C,选 C.【变式探究】袋中共有 15 个除了颜色外完全相同的球,其中有 10 个白球,5 个红球从袋中任取 2 个球,所取的 2 个球中恰有 1 个白球,1 个红球的概率为()A.521B.1021C.1121D1【解析】(1)方法一:从袋中取出 2 个球的方法
32、有 C215105(种),取出 1 个白球的方法有 C11010(种),取出 1 个红球的方法有 C155(种),故取 2 个球,1 白 1 红的方法有 C110C1550(种),所以 P501051021.方法二(间接法):从袋中取出 2 个球的方法有 C215105(种),若取出的 2 个球是同色的,则取出的方法25有 C210C2555(种)记“取出的 2 个球同色”为事件 A,则 P(A)551051121.因此,取出的 2 个球不同色的概率为 P1P(A)1021.【变式探究】有 5 支彩笔(除颜色外无差别),颜色分别为红、黄、蓝、绿、紫从这 5 支彩笔中任取 2支不同颜色的彩笔,则
33、取出的 2 支彩笔中含有红色彩笔的概率为()A.45B.35C.25D.15【解析】从 5 支彩笔中任取 2 支不同颜色彩笔的取法有红黄、红蓝、红绿、红紫、黄蓝、黄绿、黄紫、蓝绿、蓝紫、绿紫,共 10 种,其中取出的 2 支彩笔中含有红色彩笔的取法有红黄、红蓝、红绿、红紫,共4 种,所以所求概率 P41025.故选 C.【答案】C高频考点三高频考点三概率与其他知识的交汇概率与其他知识的交汇例 3.某超市计划按月订购一种酸奶,每天进货量相同,进货成本每瓶 4 元,售价每瓶 6 元,未售出的酸奶降价处理,以每瓶2元的价格当天全部处理完 根据往年销售经验,每天需求量与当天最高气温(单位:)有关如果最
34、高气温不低于 25,需求量为 500 瓶;如果最高气温位于区间20,25),需求量为 300 瓶;如果最高气温低于 20,需求量为 200 瓶为了确定六月份的订购计划,统计了前三年六月份各天的最高气温数据,得下面的频数分布表:最高气温10,15)15,20)20,25)25,30)30,35)35,40)天数216362574以最高气温位于各区间的频率估计最高气温位于该区间的概率(1)估计六月份这种酸奶一天的需求量不超过 300 瓶的概率(2)设六月份一天销售这种酸奶的利润为 Y(单位:元)当六月份这种酸奶一天的进货量为 450 瓶时,写出 Y 的所有可能值,并估计 Y 大于零的概率【解析】(
35、1)这种酸奶一天的需求量不超过 300 瓶,当且仅当最高气温低于 25,由表格数据知,最高气温低于 25 的频率为21636900.6,所以这种酸奶一天的需求量不超过 300 瓶的概率的估计值为 0.6.(2)当这种酸奶一天的进货量为 450 瓶时,若最高气温不低于 25,则 Y64504450900;若最高气温位于区间20,25),则 Y63002(450300)4450300;26若最高气温低于 20,则 Y62002(450200)4450100,所以,Y 的所有可能值为 900,300,100.Y 大于零当且仅当最高气温不低于 20,由表格数据知,最高气温不低于 20 的频率为3625
36、74900.8,因此 Y 大于零的概率的估计值为 0.8.【变式探究】某汽车美容公司为吸引顾客,推出优惠活动:对首次消费的顾客,按 200 元/次收费,并注册成为会员,对会员逐次消费给予相应优惠,标准如下表:消费次数第 1 次第 2 次第 3 次第 4 次第 5 次及以上收费比例10.950.900.850.80该公司从注册的会员中,随机抽取了 100 位进行统计,得到统计数据如下表:消费次数第 1 次第 2 次第 3 次第 4 次第 5 次及以上频数60201055假设汽车美容一次,公司成本为 150 元,根据所给数据,解答下列问题:(1)估计该公司一位会员至少消费两次的概率;(2)某会员仅
37、消费两次,求这两次消费中,公司获得的平均利润;(3)该公司要从这 100 位里至少消费两次的顾客中按消费次数用分层抽样方法抽出 8 人,再从这 8 人中抽出 2 人发放纪念品,求抽出的 2 人中恰有 1 人消费两次的概率【解析】(1)100 位会员中,至少消费两次的会员有 40 位,所以估计一位会员至少消费两次的概率为401000.4.(2)该会员第 1 次消费时,公司获得的利润为 20015050(元)第 2 次消费时,公司获得的利润为 2000.9515040(元),所以,公司获得的平均利润为5040245(元)。(3)因为 20:10:5:54:2:1:1,所以用分层抽样方法抽出的 8
38、人中,消费 2 次的有 4 人,分别设为 A1,A2,A3,A4,消费 3 次的有 2 人,分别设为 B1,B2,消费 4 次和 5 次及以上的各有 1 人,分别设为C,D,从中抽出 2 人,抽到 A1的有 A1A2,A1A3,A1A4,A1B1,A1B2,A1C,A1D,共 7 种;去掉 A1后,抽到 A2的有 A2A3,A2A4,A2B1,A2B2,A2C,A2D,共 6 种;去掉 A1,A2,A3,A4,B1,B2后,抽到 C 的有:CD,共 1 种,总的抽取方法有 765432128 种,其中恰有 1 人消费两次的抽取方法有 444416 种,27所以,抽出的 2 人中恰有 1 人消费
39、两次的概率为162847.高频考点四高频考点四抽样方法抽样方法例 4.(2018 年全国 III 卷)某公司有大量客户,且不同年龄段客户对其服务的评价有较大差异为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样、分层抽样和系统抽样,则最合适的抽样方法是_【答案】分层抽样【解析】由于从不同龄段客户中抽取,故采用分层抽样,故答案为:分层抽样。【变式探究】(1)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为 200,400,300,100 件为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取 60 件进行检验,则应从丙种型号的产品中抽取_件;(2)在一次马拉松
40、比赛中,35 名运动员的成绩(单位:分钟)的茎叶图如图所示.若将运动员按成绩由好到差编为135号,再用系统抽样方法从中抽取7人,则其中成绩在区间139,151上的运动员人数是_【答案】184【解析】(1)样本容量总体个数60200400300100350,应从丙种型号的产品中抽取35030018(件)(2)35 人抽取 7 人,则 n3575,而在139,151上共有 20 人,应抽取 4 人【变式探究】某月月底,某商场想通过抽取发票存根的方法估计该月的销售总额先将该月的全部销售发票的存根进行了编号,1,2,3,然后拟采用系统抽样的方法获取一个样本若从编号为 1,2,3,10 的前 10 张发
41、票的存根中随机抽取 1 张,然后再按系统抽样的方法依编号顺序逐次产生第 2 张、第 3 张、第 4 张、,则抽样中产生的第 2 张已编号的发票存根,其编号不可能是()A13B17C19D23【解析】因为第一组的编号为 1,2,3,10,所以根据系统抽样的定义可知第二组的编号为 11,12,13,20,故第 2 张已编号的发票存根的编号不可能为 23.28【答案】D高频考点五、高频考点五、用样本估计总体用样本估计总体例 5、我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查通过抽样,获得了某年 100 位居民每人的月均用水量(单位:吨)将数据按照0,0.5),0.5
42、,1),4,4.5分成 9 组,制成了如图所示的频率分布直方图(1)求直方图中 a 的值;(2)设该市有 30 万居民,估计全市居民中月均用水量不低于 3 吨的人数,说明理由;(3)估计居民月均用水量的中位数【解析】(1)由频率分布直方图可知,月均用水量在0,0.5)的频率为 0.080.50.04,同理,在0.5,1),1.5,2),2,2.5),3,3.5),3.5,4),4,4.5组的频率分别为 0.08,0.21,0.25,0.06,0.04,0.02.由 1(0.040.080.210.250.060.040.02)0.5a0.5a,解得 a0.30.(2)由(1)知,该市 100
43、位居民中月均用水量不低于 3 吨的频率为 0.060.040.020.12.由以上样本的频率分布,可以估计 30 万居民中月均用水量不低于 3 吨的人数为 300 0000.1236 000.(3)设中位数为 x 吨因为前 5 组的频率之和为 0.040.080.150.210.250.730.5,而前 4 组的频率之和为 0.040.080.150.210.480.5,所以 2x2.5.由 0.50(x2)0.50.48,解得 x2.04.故可估计居民月均用水量的中位数为 2.04 吨【变式探究】一个样本 a,3,5,7 的平均数是 b,且 a、b 是方程 x25x40 的两根,则这个样本的
44、方差是()29A3B4C5D6【解析】由 x25x40 的两根分别为 1,4,所以有a1,b4或a4,b1.又 a,3,5,7 的平均数是 b.即a3574b,a154b,a154b,所以a1,b4符合题意,则方差 s25.【答案】C高频考点六变量的相关性与统计案例例 6、(1)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了 2014 年 1 月至 2016年 12 月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图根据该折线图,下列结论错误的是()A月接待游客量逐月增加B年接待游客量逐年增加C各年的月接待游客量高峰期大致在 7,8 月D各年 1 月至 6 月的月接待游
45、客量相对于 7 月至 12 月,波动性更小,变化比较平稳(2)为了研究某班学生的脚长 x(单位:厘米)和身高 y(单位:厘米)的关系,从该班随机抽取 10 名学生,根据测量数据的散点图可以看出y与x之间有线性相关关系 设其回归直线方程为ybxa.已知错误!i225,错误!i1 600,b4.该班某学生的脚长为 24,据此估计其身高为()A160B163C166D170【解析】(1)根据折线图可知,2014 年 8 月到 9 月、2014 年 10 月到 11 月等月接待游客量都是减少,30所以 A 错误(2)错误!i225,x110错误!i22.5.错误!i1 600,y110错误!i160.
46、又b4,aybx160422.570.回归直线方程为y4x70.将 x24 代入上式得y42470166.故选 C.【变式探究】已知变量 x 与 y 之间的回归直线方程为y32x,若错误!i17,则错误!i的值等于()A3B4C0.4D40【解析】依题意 x17101.7,而直线y32x 一定经过样本点的中心(x,y),所以 y32 x321.70.4,所以错误!i0.4104.【答案】B1【2019 年高考全国卷文数】西游记 三国演义 水浒传和红楼梦是中国古典文学瑰宝,并称为中国古典小说四大名著某中学为了解本校学生阅读四大名著的情况,随机调查了 100 位学生,其中阅读过西游记或红楼梦的学生
47、共有 90 位,阅读过红楼梦的学生共有 80 位,阅读过西游记且阅读过红楼梦的学生共有 60 位,则该校阅读过西游记的学生人数与该校学生总数比值的估计值为A0.5B0.6C0.7D0.8【答案】C【解析】由题意得,阅读过西游记的学生人数为 90-80+60=70,31则其与该校学生人数之比为 70100=0.7故选 C2【2019 年高考全国卷文数】某学校为了解 1 000 名新生的身体素质,将这些学生编号为 1,2,1 000,从这些新生中用系统抽样方法等距抽取 100 名学生进行体质测验若 46 号学生被抽到,则下面 4 名学生中被抽到的是A8 号学生B200 号学生C616 号学生D81
48、5 号学生【答案】C【解析】由已知将 1000 名学生分成 100 个组,每组 10 名学生,用系统抽样,46 号学生被抽到,所以第一组抽到 6 号,且每组抽到的学生号构成等差数列 na,公差10d,所以6 10nan()nN,若86 10n,解得15n,不合题意;若2006 10n,解得19.4n,不合题意;若6166 10n,则61n,符合题意;若8156 10n,则80.9n,不合题意故选 C3【2019 年高考全国卷文数】生物实验室有 5 只兔子,其中只有 3 只测量过某项指标,若从这 5 只兔子中随机取出 3 只,则恰有 2 只测量过该指标的概率为A23B35C25D15【答案】B【
49、解析】设其中做过测试的 3 只兔子为,a b c,剩余的 2 只为,A B,则从这5只中任取3只的所有取法有,a b ca b Aa b Ba c Aa c Ba A Bb c A,,b c Bb A Bc A B,共 10 种其中恰有 2 只做过测试的取法有,a b Aa b Ba c Aa c B,b c Ab c B,共 6 种,所以恰有 2 只做过测试的概率为63105,故选 B4【2019 年高考江苏卷】已知一组数据 6,7,8,8,9,10,则该组数据的方差是_【答案】53【解析】由题意,该组数据的平均数为67889 1086 ,所以该组数据的方差是22222215(68)(78)
50、(88)(88)(98)(108)635【2019 年高考全国卷文数】我国高铁发展迅速,技术先进经统计,在经停某站的高铁列车中,32有 10 个车次的正点率为 0.97,有 20 个车次的正点率为 0.98,有 10 个车次的正点率为 0.99,则经停该站高铁列车所有车次的平均正点率的估计值为_【答案】0.98【解析】由题意得,经停该高铁站的列车正点数约为10 0.9720 0.98 10 0.9939.2,其中高铁个数为1020 1040,所以该站所有高铁平均正点率约为39.20.98406【2019 年高考全国卷文数】某商场为提高服务质量,随机调查了 50 名男顾客和 50 名女顾客,每位