《专题概率与统计(解析版).docx》由会员分享,可在线阅读,更多相关《专题概率与统计(解析版).docx(27页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、专题1.4 概率与统计题组一、 独立性检验与线回归方程及其应用1-1、(2021年全国高考甲卷数学(理)试题)甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:一级品二级品合计甲机床15050200乙机床12080200合计270130400(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?(2)能否有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异?附:0.0500.0100.001k3.8416.63510.828【解析】(1)甲机床生产的产品中的一级品的频率为,乙机床生产的产品
2、中的一级品的频率为.(2),故能有99%的把握认为甲机床的产品与乙机床的产品质量有差异.1-2、(2021江苏常州市高三期末)某公司在市场调查中,发现某产品的单位定价(单位:万元/吨)对月销售量(单位:吨)有影响.对不同定价和月销售量数据作了初步处理,0.244390.164820683956表中.经过分析发现可以用来拟合与的关系.(1)求关于的回归方程;(2)若生产吨产品的成本为万元,那么预计价格定位多少时,该产品的月利润取最大值,求此时的月利润.附:对于一组数据,其回归直线线的的斜率和截距的最小二乘估计分别为:,.【解析】(1)令,则,然后利用表中数据结合公式,分别求得即可.(2)根据生产
3、吨产品的成本为万元,建立月利润函数,利用基本不等式求解.【详解】(1)令,则,则,,(2)月利润(当且仅当即时取等号)答:(1)关于的回归方程为;(2)预计价格定位万元/吨时,该产品的月利润取最大值,最大值为万元.1-3、(2021重庆八中高三其他模拟)某机构为研究考生物理成绩与数学成绩之间的关系,从一次考试中随机抽取名考生的数据,统计如下表:数学成绩物理成绩(1)由表中数据可知,有一位考生因物理缺考导致数据出现异常,剔除该组数据后发现,考生物理成绩与数学成绩之间具有线性相关关系,请根据这组数据建立关于的回归直线方程,并估计缺考考生如果参加物理考试可能取得的成绩;(2)已知参加该次考试的名考生
4、的物理成绩服从正态分布,用剔除异常数据后的样本平均值作为的估计值,用剔除异常数据后的样本标准差作为的估计值,估计物理成绩不低于分的人数的期望.附:参考数据:上表中的;表示样本中第名考生的数学成绩,;表示样本中第名考生的物理成绩,.参考公式:对于一组数据:,其方差:.对于一组数据,其回归直线的斜率和截距的最小二乘估计分别为:,.若随机变量服从,则,.【解析】(1)设根据剔除后数据建立的关于的回归直线方程为,剔除异常数据后的数学平均分为,剔除异常数据后的物理平均分为,则,则,所以所求回归直线方程为.又物理缺考考生的数学成绩为,所以估计其可能取得的物理成绩为.(2)由题意知,因为,所以,所以参加该次
5、考试的名考生的物理成绩服从正态分布,则物理成绩不低于分的概率为,由题意可知,所以物理成绩不低于分的人数的期望.1-4、(2021山东日照市高三二模)近年来,随着猪肉价格的上涨,作为饲料原材料之一的玉米,价格也出现了波动为保证玉米销售市场稳定,相关部门某年9月份开始采取宏观调控措施该部门调查研究发现,这一年某地各月份玉米的销售均价(元斤)走势如图所示:(1)该部门发现,3月到7月,各月玉米销售均价y(元斤)与月份x之间具有较强的线性相关关系,试建立y关于x的回归方程(系数精确到0.01),若不调控,依据相关关系预测12月份玉米的销售均价;(2)该部门在这一年的12个月份中,随机抽取3个月份的数据
6、作样本分析,若关注所抽三个月份的所属季度,记不同季度的个数为X,求X的分布列和数学期望参考数据:回归方程中斜率和截距的最小二乘估计公式分别为:【解析】(1)由图写出37所对应均价,并算出它们的平均数,利用最小二乘法计算即可得解;(2)写出随机变量X的所有可能值,并算出各值对应的概率,列出分布列算出期望得解.【详解】(1)由题意月份x34567均价y0.950.981.111.121.20计算可得:,从3月到7月,y关于x的回归方程为,当时,代入回归方程得,即可预测第12月份玉米销售均价为1.47元/斤;(2)X的取值为1,2,3,X的分布列为X123P.1-5、(2021山东青岛市高三二模)现
7、对某市工薪阶层对于“楼市限购令”的态度进行调查,随机抽调了50人,他们月收入(单位:百元)的频数分布及对“楼市限购令”赞成人数如下表:月收入频数510151055赞成人数4812521(1)根据以上统计数据完成下面的列联表,并问能否有97.5%的把握认为“某市工薪阶层对于楼市限购令的态度与月收入以6500元为分界点有关”?月收入不低于65百元的人数月收入低于65百元的人数合计赞成不赞成合计(2)若对月收入在和的被调查人中各随机选取两人进行追踪调查,求在选中的4人中有人不赞成的条件下,赞成“楼市限购令”的人数的分布列及数学期望.附:,.0.0500.0250.0100.0050.0013.841
8、5.0246.6357.87910.828【解析】(1)根据频数分布表中数据可得列联表,计算出可得把握度(2)的取值分别是,求出各概率得分布列,由期望公式计算期望【详解】(1)由题意列联表如下:月收入不低于65百元的人数月收入低于65百元的人数合计赞成32932不赞成71118合计104050,所以有97.5%的把握认为“某市工薪阶层对于楼市限购令的态度与月收入以6500元为分界点有关”(2)的取值分别是,,记4人中有人不赞成为事件,则,同理,所以的分布列为:0123401-6、(2021山东青岛市高三三模)一场科普知识竞答比赛由笔试和抢答两部分组成,若笔试和抢答满分均为100分,其中5名选手
9、的成绩如下表所示:选手笔试分8790919295抢答分8689899294对于这5名选手,根据表中的数据,试解答下列两个小题:(1)求关于的线性回归方程;(2)现要从笔试成绩在90分或90分以上的选手中选出2名参加一项活动,以表示选中的选手中笔试和抢答成绩的平均分高于90分的人数,求随机变量的分布列及数学期望.附:【解析】(1),所以,故回归直线方程为.(2)随机变量的可能取值为0,1,2,因为笔试成绩在90分或90分以上的选手有共4人,他们笔试和抢答的成绩平均分分别为:,平均分高于90分的有2人,所以,故的分布列为012所以.题组二、离散型随机变量分布列、期望2-1、(2021年全国新高考卷
10、数学试题)某学校组织“一带一路”知识竞赛,有A,B两类问题,每位参加比赛的同学先在两类问题中选择一类并从中随机抽取一个问题回答,若回答错误则该同学比赛结束;若回答正确则从另一类问题中再随机抽取一个问题回答,无论回答正确与否,该同学比赛结束.A类问题中的每个问题回答正确得20分,否则得0分;B类问题中的每个问题回答正确得80分,否则得0分,己知小明能正确回答A类问题的概率为0.8,能正确回答B类问题的概率为0.6,且能正确回答问题的概率与回答次序无关.(1)若小明先回答A类问题,记为小明的累计得分,求的分布列;(2)为使累计得分的期望最大,小明应选择先回答哪类问题?并说明理由.【解析】(1)由题
11、可知,的所有可能取值为,;所以的分布列为(2)由(1)知,若小明先回答问题,记为小明的累计得分,则的所有可能取值为,;所以因为,所以小明应选择先回答类问题2-2、(2021山东滨州市高三二模)为落实中央“坚持五育并举,全面发展素质教育,强化体育锻炼”的精神,某高中学校鼓励学生自发组织各项体育比赛活动,甲乙两名同学利用课余时间进行乒乓球比赛,规定:每一局比赛中获胜方记1分,失败方记0分,没有平局,首先获得5分者获胜,比赛结束.假设每局比赛甲获胜的概率都是.(1)求比赛结束时恰好打了6局的概率;(2)若甲以3:1的比分领先时,记X表示到结束比赛时还需要比赛的局数,求X的分布列及期望.【解析】(1)
12、比赛恰好打了6局的情况有两种:甲胜或乙胜,即可求解;(2)分析可知X的可能取值为2,3,4,5,分别求出对应的概率,由此能求出X的分布列和.【详解】解:(1)比赛结束时恰好打了6局,甲获胜的概率为,恰好打了6局,乙获胜的概率为,所以比赛结束时恰好打了6局的概率为.(2)X的可能取值为2,3,4,5,.所以X的分布列如下:2345故.2-3、(2021山东聊城市高三三模)2021年3月5日李克强总即在政府作报告中特别指出:扎实做好碳达峰,碳中和各项工作,制定2030年前碳排放达峰行动方案,优化产业结构和能源结构某环保机器制造商为响应号召,对一次购买2台机器的客户推出了两种超过机器保修期后5年内的
13、延保维修方案:方案一;交纳延保金5000元,在延保的5年内可免费维修2次,超过2次每次收取维修费1000元;方案二:交纳延保金6230元,在延保的5和内可免费维修4次,超过4次每次收取维修费t元;制造商为制定的收取标准,为此搜集并整理了200台这种机器超过保修期后5年内维修的次数,统计得到下表维修次数0123机器台数20408060以这200台机器维修次数的频率代替1台机器维修次数发生的概率,记X表示2台机器超过保修期后5年内共需维修的次数(1)求X的分布列;(2)以所需延保金与维修费用之和的均值为决策依据,为使选择方案二对客户更合算,应把t定在什么范围?【解析】(1)根据统计表,维修0、1、
14、2、3次的机器的比例分别为、,而2台机器超过保修期后5年内共需维修的次数可能有,对应的基本事件为、,进而可求各可能值的概率,写出分布列即可.(2)根据两个方案的描述,结合(1)所得的分布列,分别写出方案一、方案二所需费用的分布列,进而求它们的期望,要使选择方案二对客户更合算有,即可求的范围.【详解】(1)由题意得,X的分布列为X0123456P(2)选择方案一:所需费用为元,则时,时,;时,;时,时,的分布列为50006000700080009000,选择方案二:所需费用为元,则时,;时,;时,则的分布列为6230,要使选择方案二对客户更合算,则,解得,即的取值范围为2-4、(2020河北邯郸
15、市高三期末)某芯片生产流水线检测员每天随机从流水线上抽取100个新生产的芯片进行检测.若每块芯片的生产成本为1000元,一级品每个芯片可卖1500元,二级品每个芯片可卖900元,三级品禁止出厂且销毁.某日检测抽取的100个芯片的柱状图如图所示(用样本的频率代替概率).(1)若该生产线每天生产2000个芯片,求出该生产线每天利润的平均值;(2)若从出厂的所有芯片中随机取出3个,求其中二级品芯片个数的分布列期望与方差.【解析】(1)该生产线每天利润的平均值元. (2)由题意得, ,.其分布列为0123. .2-5、(2021湖北襄阳市襄阳五中高三二模)随着商用进程的不断加快,手机厂商之间围绕用户的
16、争夺越来越激烈,手机也频频降价飞入寻常百姓家某科技公司为了打开市场,计划先在公司进行“抽奖免费送手机”优惠活动方案的内部测试,测试成功后将在全市进行推广公司内部测试的活动方案设置了第次抽奖中奖的名额为,抽中的用户退出活动,同时补充新的用户,补充新用户的名额比上一次中奖用户的名额少个若某次抽奖,剩余全部用户均中奖,则活动结束参加本次内部测试第一次抽奖的有人,甲、乙均在其中(1)求甲在第一次中奖且乙在第二次中奖的概率是多少;(2)求甲乙参加抽奖活动次数之和的分布列和期望【解析】(1)甲在第一次中奖且乙在第二次中奖概率;设甲乙参加抽奖活动的次数之和为,则;,随机变量的分布列为2-6、(2021河北保
17、定市高三二模)“学习强国”学习平台是由中宣部主管,以深入学习宣传习近平新时代中国特色社会主义思想为主要内容,立足全体党员面向全社会的优质平台,现日益成为老百姓了解国家动态紧跟时代脉搏的热门APP.该款软件主要设有“阅读文章”“视听学习”两个学习模块和“每日答题”“每周答题”“专项答题”“挑战答题”四个答题模块,还有“四人赛”“双人对战”两个比赛模块.某人在一天的学习过程中,每日登录积1分,除此之外只参与了“四人赛”.“四人赛”积分规则为首局第一名积3分,第二三名积2分,第四名积1分;第二局第一名积2分,其余名次积1分;每日仅前两局得分.已知该人参与“四人赛”获得每种名次的概率均为,且每次答题相
18、互独立,(1)求该人在一天学习过程中积3分的概率;(2)设该人在一天学习过程中积分为,求的分布列和数学期望.【解析】(1)依题意可知,登录积1分,所以若积3分,则需比赛得分即第一局积1分,第二局积1分,所以.(2)的取值为,;.故的分布列为 所以题型三、概率等综合3-1、(2021山东临沂市高三二模)2021年是“十四五”规划开局之年,也是建党100周年为了传承红色基因,某学校开展了“学党史,担使命”的知识竞赛现从参赛的所有学生中,随机抽取100人的成绩作为样本,得到成绩的频率分布直方图,如图(1)求频率分布直方图中的值,并估计该校此次竞赛成绩的平均分(同一组中的数据用该组区间中点值代表);(
19、2)在该样本中,若采用分层抽样的方法,从成绩高于75分的学生中随机抽取7人查看他们的答题情况,再从这7人中随机抽取3人进行调查分析,求这3人中至少有1人成绩在内的概率;(3)假设竞赛成绩服从正态分布,已知样本数据的方差为121,用平均分作为的近似值,用样本标准差作为的估计值,求该校本次竞赛的及格率(60分及以上为及格)参考数据:,【解析】解:(1)由频率分布直方图可得,解得这组样本数据的平均数为所以估计该校此次竞赛成绩的平均分为71分;(2)自频率分布直方图可知,成绩在,内的频率分别为0.25,0.1所以采用分层抽样的方法从样本中抽取的7人,成绩在内的有5人,成绩在内的有2人记事件这3人至少有
20、1人成绩在内则;(3)由题意知,样本方差,故,所以竞赛成绩该校竞赛的及格率3-2、(2021山东烟台市高三二模)随着时代发展和社会进步,教师职业越来越受青睐,考取教师资格证成为不少人的就业规划之一当前,中小学教师资格考试分笔试和面试两部分已知某市2020年共有10000名考生参加了中小学教师资格考试的笔试,现从中随机抽取100人的笔试成绩(满分视为100分)作为样本,整理得到如下频数分布表:笔试成绩人数51025302010(1)假定笔试成绩不低于90分为优秀,若从上述样本中笔试成绩不低于80分的考生里随机抽取2人,求至少有1人笔试成绩为优秀的概率;(2)由频数分布表可认为该市全体考生的笔试成
21、绩近似服从正态分布,其中近似为100名样本考生笔试成绩的平均值(同一组中的数据用该组区间的中点值代替),据此估计该市全体考生中笔试成绩不低于85.9的人数(结果四舍五入精确到个位)(3)考生甲为提升综合素养报名参加了某拓展知识竞赛,该竞赛要回答3道题,前两题是哲学知识,每道题答对得3分,答错得0分;最后一题是心理学知识,答对得4分,答错得0分已知考生甲答对前两题的概率都是,答对最后一题的概率为,且每道题答对与否相互独立,求考生甲的总得分的分布列及数学期望(参考数据:;若,则,)【解析】(1)有表格数据知样本中笔试成绩不低于80分的考生共30人,成绩优秀10人,利用古典概型的概率求法求概率即可.
22、(2)由表格数据求,又,易知,依据正态分布的三段区间概率值即可求概率,进而估算该市全体考生中笔试成绩不低于85.9的人数.(3)由题意知,甲的总得分的可能取值为0,3,4,6,7,10,应用独立事件的乘法公式求各取值的概率,列出分布列,根据分布列求期望即可.【详解】(1)由已知,样本中笔试成绩不低于80分的考生共30人,其中成绩优秀10人(2)有表格数据知,又,即,由此可估计该市全体考生笔试成绩不低于85.9分的人数为人(3)考生甲的总得分的所有可能取值为0,3,4,6,7,10,的分布列为:03467103-3、(2021山东日照市高三其他模拟)为了了解扬州市高中生周末运动时间,随机调查了名
23、学生,统计了他们的周末运动时间,制成如下的频数分布表:周末运动时间(分钟)人数(1)从周末运动时间在的学生中抽取人,在的学生中抽取人,现从这人中随机推荐人参加体能测试,记推荐的人中来自的人数为,求的分布列和数学期望;(2)由频数分布表可认为:周末运动时间服从正态分布,其中为周末运动时间的平均数,近似为样本的标准差,并已求得可以用该样本的频率估计总体的概率,现从扬州市所有高中生中随机抽取名学生,记周末运动时间在之外的人数为,求(精确到);参考数据1:当时,参考数据2:,.【解析】(1)由题意可知,随机变量的可能取值有、,计算出随机变量在不同取值下的概率,可得出随机变量的分布列,进一步可求得的值;
24、(2)计算得出,可求得或,可得出,再利用独立重复试验的概率公式可求得.【详解】(1)随机变量的可能取值为、,所以,随机变量的分布列如下表所示:所以;(2),又,所以,所以或,所以,所以.3-4、(2021山东高三其他模拟)为做好精准扶贫工作,农科所经实地考察,发现某贫困村的土地适合种植药材,村民可以通过种植药材增加收入,达到脱贫标准.通过大量考察研究得到如下统计数据:药材的收购价格处于上涨趋势,最近五年的价格如下表:年份20162017201820192020年份编号12345单价(元/公斤)1820232529药材的亩产量在2020年的频率分布直方图如下:(1)若药材的单价(单位:元/公斤)
25、与年份编号间具有线性相关关系,请求出关于的回归直线方程,并估计2021年药材的单价;(2)利用上述频率分布直方图估计药材的平均亩产量(同组数据以该数据所在区间的中点值为代表);(3)称亩产量不高于390公斤的田地为“待改良田”,将频率视为概率,现农科所研究员从这个村的地中随机选取3块面积为1亩的田地进行试验,记其中“待改良田”的个数为,求随机变量的数学期望.参考公式:回归直线方程,其中,.【答案】(1),单价为元/公斤;(2)401公斤;(3).【解析】(1)先求出年号x,单价y的平均数,利用最小二乘法得回归直线方程,再由此预测得解;(2)求出频率分布直方图中各组的频率,再求出它与所对各组区间
26、中点值的积而得解;(3)随机变量服从二项分布,由二项分布的期望公式求解即得.【详解】(1),故回归直线方程为,当时,从而2021年药材的单价估计为元/公斤;(2)组距为20,自左向右各组的频率依次为,则药材的平均亩产量为公斤;(3)称亩产量不高于390公斤的频率为0.3,由此估计称亩产量不高于390公斤的概率为0.3,因3块地中,任取一块地有“待改良田”和非“待改良田”两个不同结果,则随机变量,故数学期望.3-5、(2021山东淄博市高三二模)某市在司法知识宣传周活动中,举办了一场司法知识网上答题考试,要求本市所有机关、企事业单位工作人员均要参加考试,试题满分为100分,考试成绩大于等于90分
27、的为优秀考试结束后,组织部门从所有参加考试的人员中随机抽取了200人的成绩作为统计样本,得到样本平均数为82、方差为64假设该市机关、企事业单位工作人员有20万人,考试成绩服从正态分布(1)估计该市此次司法考试成绩优秀者的人数有多少万人?(2)该市组织部门为调动机关、企事业单位工作人员学习司法知识的积极性,制定了如下奖励方案:所有参加考试者,均可参与网上“抽奖赢手机流量”活动,并且成绩优秀者可有两次抽奖机会,其余参加者抽奖一次抽奖者点击抽奖按钮,即随机产生一个两位数,若产生的两位数的数字相同,则可获赠手机流量5G,否则获赠手机流量1G假设参加考试的所有人均参加了抽奖活动,试估计此次抽奖活动赠予
28、的手机流量总共有多少G?参考数据:若,则【解析】(1)由题意,随机抽取了200人的成绩作为统计样本,得到样本平均数为82、方差为64,即,所以考试成绩优秀者得分,即又由,得所以估计该市此次司法考试成绩优秀者人数可达万人(2)设每位抽奖者获赠的手机流量为G,则的值为1,2,5,6,10可得,所以随机变量的分布列为:125610所以(G)因此,估计此次抽奖活动赠予的手机流量总值为(万G)3-6、(2021山东泰安市高三一模)某市为了了解本市初中生周末运动时间,随机调查了名学生,统计了他们的周末运动时间,制成如图所示的频率分布直方图.(1)按照分层抽样,从和中随机抽取了名学生.现从已抽取的名学生中随机推荐名学生参加体能测试.记推荐的名学生来自的人数为,求的分布列和数学期望;(2)由频率分布直方图可认为:周末运动时间服从正态分布,其中,为周末运动时间的平均数,近似为样本的标准差,并已求得.可以用该样本的频率估计总体的概率,现从本市所有初中生中随机抽取名学生,记周末运动时间在之外的人数为,求(精确到).参考数据:当时,.参考数据: .【解析】解:运动时间在的人数为人.运动时间在的人数为人.按照分层抽样共抽取人,则在上抽取的人数为人,在上抽取的人数为人.随机变量的所有可能取值为,.所以随机变量的分布列为,(或)学科网(北京)股份有限公司