《五类概率与统计-2024年高考数学大题秒杀技巧(新高考专用)(解析版).pdf》由会员分享,可在线阅读,更多相关《五类概率与统计-2024年高考数学大题秒杀技巧(新高考专用)(解析版).pdf(53页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、五类概率与统计题型-2024高考数学大题秒杀技巧五类概率与统计题型-2024高考数学大题秒杀技巧概率与统计问题一般分为五类:概率与统计问题一般分为五类:类型1:独立性检验问题;类型2:线性回归及非线性回归问题;类型3:超几何分布问题;类型4:二项分布问题 类型5:正态分布问题。下面给大家对每一个类型进行秒杀处理.类型1:独立性检验问题类型1:独立性检验问题1.分层抽样一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫做分层抽样。分层抽样适用于已知总体是由差异明显的几部分组成的。注:求某层应抽个体数量:按
2、该层所占总体的比例计算已知某层个体数量,求总体容量或反之求解:根据分层抽样就是按比例抽样,列比例式进行计算分层抽样的计算应根据抽样比构造方程求解,其中“抽样比=样本容量总体容量=各层样本数量各层个体数量”2.频率分布直方图(1)频率、频数、样本容量的计算方法频率组距组距=频率频数样本容量=频率,频数频率=样本容量,样本容量频率=频数频率分布直方图中各个小方形的面积总和等于1.3.频率分布直方图中数字特征的计算(1)最高的小长方形底边中点的横坐标即是众数(2)中位数左边和右边的小长方形的面积和是相等的设中位数为x,利用x左(右)侧矩形面积之和等于0.5,即可求出x(3)平均数是频率分布直方图的“
3、重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和,即有x=x1p1+x1p1+xnpn,其中xn为每个小长方形底边的中点,pn为每个小长方形的面积4.独立性检验(1)定义:利用独立性假设、随机变量K2来确定是否有一定把握认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验1(2)公式:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d为样本容量(3)独立性检验的具体步骤如下:计算随机变量K2的观测值k,查下表确定临界值k0:p K2k00.50.400.250.150.100.050.0250.0100.0050.00
4、1k00.4550.7081.3232.0722.7063.8415.0246.6357.87910.828如果kk0,就推断“X与Y有关系”,这种推断犯错误的概率不超过p K2k0;否则,就认为在犯错误的概率不超过p K2k0的前提下不能推断“X与Y有关系”独立性检验独立性检验问题专项训练问题专项训练1为提升学生实践能力和创新能力,某校在高一,高二年级开设“航空模型制作选修课程为考察课程开设情况,学校从两个年级选修该课程的学生中各随机抽取20名同学分别制作一件航空模型并根据每位同学作品得分绘制了如图所示的茎叶图若作品得分不低于80,评定为“优良”,否则评定为“非优良”高一同学作品高二同学作品
5、88326579654322107138799622182345677899539078(1)请完成下面的22列联表;优良非优良合计高一高二合计(2)判断是否有90%的把握认为作品是否“优良”与制作者所处年级有关?附:K2=n ad-bc2a+bc+da+cb+d,n=a+b+c+dP K2k0.1500.1000.0100.001k2.0722.7066.63510.828224月15日是全民国家安全教育日以人民安全为宗旨也是“总体国家安全观”的核心价值.只有人人参与,人人负责,国家安全才能真正获得巨大的人民性基础,作为知识群体的青年学生,是强国富民的中坚力量,他们的国家安全意识取向对国家安
6、全尤为重要.某校社团随机抽取了600名学生,发放调查问卷600份(答卷卷面满分100分)回收有效答卷560份,其中男生答卷240份,女生答卷320份.有效答卷中75分及以上的男生答卷80份,女生答卷80份,其余答卷得分都在10分至74分之间同时根据560份有效答卷的分数,绘制了如图所示的频率分布直方图(1)求频率分布直方图中m的值,并求出这560份有效答卷得分的中位数和平均数n(同一组数据用该组中点值代替).(2)如果把75分及以上称为对国家安全知识高敏感人群,74分及以下称为低敏感人群,请根据上述数据,完成下面22列联表,并判断能否有95%的把握认为学生性别与国家安全知识敏感度有关高敏感低敏
7、感总计男生80女生80总计560附:独立性检验临界值表PK2k00.10.050.010.0050.001K22.7063.8416.6357.87910.828公式:K2=n ad-bc2a+bc+da+cb+d,其中n=a+b+c+d33某学生兴趣小组随机调查了某市200天中每天的空气质量等级和当天到江滨公园锻炼的人次,整理数据得到下表(单位:天):锻炼人次空气质量等级0,200200,400400,6001(优)1220442(良)1519303(轻度污染)1616144(中度污染)752(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;并求一天中到该公园锻炼的平均人次的估计值
8、(同一组中的数据用该组区间的中点值为代表);(2)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”根据所给数据,完成下面的22列联表,并根据列联表,判断是否有99.9的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?人次400人次400空气质量好空气质量不好附:K2=n ad-bc2a+bc+da+cb+d44某市阅读研究小组为了解该城市中学生阅读与语文成绩的关系,在参加市中学生语文综合能力竞赛的各校学生中随机抽取了500人进行调查,并按学生成绩是否高于75分(满分100分)及周平均阅读时间是否少于10小时,将调查结果整理成
9、列联表.现统计出成绩不低于75分的样本占样本总数的30%,周平均阅读时间少于10小时的人数占样本总数的一半,而不低于75分且周平均阅读时间不少于10小时的样本有100人.周平均阅读时间少于10小时周平均阅读时间不少于10小时合计75分以下s不低于75分t100合计500(1)根据所给数据,求出表格中s和t的值,并分析能否有99.9%以上的把握认为语文成绩与阅读时间是否有关;(2)先从成绩不低于75分的样本中按周平均阅读时间是否少于10小时分层抽样抽取9人进一步做问卷调查,然后从这9人中再随机抽取3人进行访谈,记抽取3人中周平均阅读时间不少于10小时的人数为X,求X的分布列与均值.参考公式及数据
10、:2=n(ad-bc)2a+bc+da+cb+d,n=a+b+c+d.0.010.0050.001x6.6357.87910.82855一个航空航天的兴趣小组,对500名男生和500名女生关于航空航天是否感兴趣的话题进行统计,情况如下表所示男生女生感兴趣380220不感兴趣120280P(K2k)0.0500.0250.0100.0050.001k3.8415.0246.6357.87910.828附:K2=n ad-bc2a+bc+da+cb+d,n=a+b+c+d(1)是否有99.9%的把握认为对航空航天感兴趣的情况与性别相关联?(2)一名兴趣小组成员在试验桌上进行两艘飞行器模型间的“交会
11、对接”游戏,左边有2艘“Q2运输船”和1艘“M1转移塔”,右边有3艘“M1转移塔”假设两艘飞行器模型间的“交会对接”重复了n次,记左边剩余2艘“Q2运输船”的概率为Pn,剩余1艘“Q2运输船”的概率为qn,求2pn+qn与2pn-1+qn-1的递推关系式;(3)在(2)情况下,求Xn的分布列与数学期望E Xn6类型类型2 2:线性回归线性回归及及非线性回归问题非线性回归问题线性回归线性回归线性回归是研究不具备确定的函数关系的两个变量之间的关系(相关关系)的方法对于一组具有线性相关关系的数据(x1,y1),(x2,y2),(xn,yn),其回归方程y=bx+a的求法为b=ni=1(xi-x)(y
12、i-y)ni=1(xi-x)2=ni=1xiyi-nxyni=1xi2-nx2a=y-bx其中,x=1nni=1xi,y=1nni=1yi,(x,y)称为样本点的中心非线性回归非线性回归建立非线性回归模型的基本步骤(1)确定研究对象,明确哪个是解释变量,哪个是预报变量;(2)画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(是否存在非线性关系);(3)由经验确定非线性回归方程的类型(如我们观察到数据呈非线性关系,一般选用反比例函数、二次函数、指数函数、对数函数、幂函数模型等);(4)通过换元,将非线性回归方程模型转化为线性回归方程模型;(5)按照公式计算线性回归方程中的参数(如最小二
13、乘法),得到线性回归方程;(6)消去新元,得到非线性回归方程;(7)得出结果后分析残差图是否有异常若存在异常,则检查数据是否有误,或模型是否合适等线性回归线性回归及及非线性回归问题专项训练非线性回归问题专项训练6某旅游公司针对旅游复苏设计了一款文创产品来提高收益该公司统计了今年以来这款文创产品定价x(单位:元)与销量y(单位:万件)的数据如下表所示:产品定价x(单位:元)99.51010.511销量y(单位:万件)1110865(1)依据表中给出的数据,判断是否可用线性回归模型拟合y与x的关系,请计算相关系数并加以说明(计算结果精确到0.01);(2)建立y关于x的回归方程,预测当产品定价为8
14、.5元时,销量可达到多少万件参考公式:r=ni=1xi-xyi-yni=1xi-x2ni=1yi-y2,b=ni=1xi-xyi-yni=1xi-x2,a=y-bx参考数据:65 8.06772023年,国家不断加大对科技创新的支持力度,极大鼓舞了企业投入研发的信心,增强了企业的创新动能.某企业在国家一系列优惠政策的大力扶持下,通过技术革新和能力提升,极大提升了企业的影响力和市场知名度,订单数量节节攀升,右表为该企业今年14月份接到的订单数量.月份t1234订单数量y(万件)5.25.35.75.8附:相关系数,r=ni=1(xi-x)(yi-y)ni=1(xi-x)2ni=1(yi-y)2回
15、归方程y=a+bx中斜率和截距的最小二乘法估计公式分别为b=ni=1(xi-x)(yi-y)ni=1(xi-x)2,a=y-bx,1.3 1.14.(1)试根据样本相关系数r的值判断订单数量y与月份t的线性相关性强弱(0.75|r|1,则认为y与t的线性相关性较强,|r|P2.(i)求p的取值范围;(ii)证明数列 Pn单调递增,并根据你的理解说明该结论的实际含义.1717为进一步加强学生的文明养成教育,推进校园文化建设,倡导真善美,用先进人物的先进事迹来感动师生,用身边的榜样去打动师生,用真情去发现美,分享美,弘扬美,某校以争做最美青年为主题,进行“最美青年”评选活动,最终评出了10位“最美
16、青年”,其中6名女生4名男生。学校准备从这10位“最美青年”中每次随机选出一人做事迹报告.(1)若每位“最美青年”最多做一次事迹报告,记第一次抽到女生为事件A,第二次抽到男生为事件B,求P B,P B|A;(2)根据不同需求,现需要从这10位“最美青年”中每次选1人,可以重复,连续4天分别为高一、高二、高三学生和全体教师做4场事迹报告,记这4场事迹报告中做报告的男生人数为X,求X的分布列和数学期望.18某大型商场为了回馈广大顾客,设计了一个抽奖活动,在抽奖箱中放8个大小相同的小球,其中4个为红色,4个为黑色抽奖方式为:每名顾客进行两次抽奖,每次抽奖从抽奖箱中一次性摸出两个小球如果每次抽奖摸出的
17、两个小球颜色相同即为中奖,两个小球颜色不同即为不中奖(1)若规定第一次抽奖后将球放回抽奖箱,再进行第二次抽奖,求中奖次数X的分布列和数学期望(2)若规定第一次抽奖后不将球放回抽奖箱,直接进行第二次抽奖,求中奖次数Y的分布列和数学期望(3)如果你是商场老板,如何在上述问两种抽奖方式中进行选择?请写出你的选择及简要理由1819某种抗病毒疫苗进行动物实验,将疫苗注射到甲乙两地一些小白鼠体内,小白鼠血样某项指标X值满足12.2X21.8时,小白鼠产生抗体从注射过疫苗的小白鼠中用分层抽样的方法抽取了210只进行X值检测,其中甲地120只小白鼠的X值平均数和方差分别为14和6,乙地90只小白鼠的X值平均数
18、和方差分别为21和17,这210只小白鼠的X值平均数与方差分别为,2(与2均取整数)用这210只小白鼠为样本估计注射过疫苗小白鼠的总体,设XN,2(1)求,2;(2)小白鼠注射疫苗后是否产生抗体相互独立,已知注射过疫苗的N只小白鼠中有102只产生抗体,试估计N的可能值(以使得P(K=102)最大的N的值作为N的估计值);(3)对这些小白鼠进行第二次疫苗注射后,有99.1%的小白鼠产生了抗体,再对这些小白鼠血样的X值进行分组检测,若每组n(n50)只小白鼠混合血样的X值在特定区间内,就认为这n只小白鼠全部产生抗体,否则要对n只小白鼠逐个检测已知单独检验一只小白鼠血样的检测费用为10元,n只小白鼠
19、混合血样的检测费用为n+9元试给出n的估计值,使平均每只小白鼠的检测费用最小,并求出这个最小值(精确到0.1元)附:若XN,2,则P(|X-|)=0.68,P(|X-|2)=0.95参考数据:21 4.6,22 4.7,23 4.8,24 4.920某公司对新生产出来的300辆新能源汽车进行质量检测,每辆汽车要由甲、乙、丙三名质检员各进行一次质量检测,三名质检员中有两名或两名以上检测不合格的将被列为不合格汽车,有且只有一名质检员检测不合格的汽车需要重新由甲、乙两人各进行一次质量检测,重新检测后,如果甲、乙两名质检员中还有一人或两人检测不合格,也会被列为不合格汽车.假设甲、乙、丙三名质检员的检测
20、相互独立,每一次检测不合格的概率为p 0p1.(1)求每辆汽车被列为不合格汽车的概率q;(2)公司对本次质量检测的预算支出是4万元,每辆汽车不需要重新检测的费用为60元,需要重新检测的前后两轮检测的总费用为100元,所有汽车除检测费用外,其他费用估算为1万元,若300辆汽车全部参与质量检测,实际费用是否会超出预算?19类型类型5 5:正态分布正态分布问题问题(1)随机变量X落在区间(a,b的概率为P(aXb)=ba,(x)dx,即由正态曲线,过点(a,0)和点(b,0)的两条x轴的垂线,及x轴所围成的平面图形的面积,如下图中阴影部分所示,就是X落在区间(a,b的概率的近似值一般地,如果对于任何
21、实数a,b(ab),随机变量X满足P(a0,P(-aX+a)=+a-a,(x)dx为下图中阴影部分的面积,对于固定的和a而言,该面积随着的减小而变大这说明越小,X落在区间(-a,+a的概率越大,即X集中在周围的概率越大特别地,有P(-X+)=0.6826;P(-2X+2)=0.9544;P(-3X+3)=0.9974由P(-3X+3)=0.9974,知正态总体几乎总取值于区间(-3,+3)之内而在此区间以外取值的概率只有0.0026,通常认为这种情况在一次试验中几乎不可能发生,即为小概率事件在实际应用中,通常认为服从于正态分布N(,2)的随机变量X只取(-3,+3)之间的值,并简称之为3原则正
22、态分布正态分布问题专项训练问题专项训练21人勤春来早,实干正当时某工厂春节后复工复产,为满足市场需求加紧生产,但由于生产设备超负荷运转导致某批产品次品率偏高已知这批产品的质量指标XN 80,2,当X 60.100时产品为正品,其余为次品生产该产品的成本为20元/件,售价为40元/件若售出次品,则不更换,需按原售价退款并补偿客户10元/件(1)若某客户买到的10件产品中恰有两件次品,现从中任取三件,求被选中的正品数量的分布列和数学期望:(2)已知P X60=0.02,工厂欲聘请一名临时质检员检测这批产品,质检员工资是按件计费,每件x元产品检测后,检测为次品便立即销毁,检测为正品方能销售假设该工厂
23、生产的这批产品都能销售完,工厂对这批产品有两种检测方案,方案一:全部检测;方案二:抽样检测若要使工厂两种检测方案的盈利均高于不检测时的盈利,求x的取值范围,并从工厂盈利的角度选择恰当的方案2022某手机APP公司对喜欢使用该APP的用户年龄情况进行调查,随机抽取了100名喜欢使用该APP的用户,年龄均在 15,65周岁内,按照年龄分组得到如下所示的样本频率分布直方图:(1)根据频率分布直方图,估计使用该视频APP用户的平均年龄的第85%分位数(小数点后保留2位);(2)若所有用户年龄X近似服从正态分布N,2,其中为样本平均数的估计值,10.5,试估计喜欢使用该APP且年龄大于61周岁的人数占所
24、有喜欢使用该APP的比例;(3)用样本的频率估计概率,从所有喜欢使用该APP的用户中随机抽取8名用户,用P X=k表示这8名用户中恰有k名用户的年龄在区间 25,35岁的概率,求P X=k取最大值时对应的k的值;附:若随机变量X服从正态分布N,2,则:P(-X+)0.6827,P(-2X+2)0.9545,P(-3X+3)0.99732123锚定2060碳中和,中国能源演进“绿之道”,为响应绿色低碳发展的号召,某地在沙漠治理过程中,计划在沙漠试点区域四周种植红柳和梭梭树用于防风固沙,中间种植适合当地环境的特色经济作物,通过大量实验发现,单株经济作物幼苗的成活率为0.8,红柳幼苗和梭梭树幼苗成活
25、的概率均为p,且已知任取三种幼苗各一株,其中至少有两株幼苗成活的概率不超过0.896(1)当p最大时,经济作物幼苗的成活率也将提升至0.88,求此时三种幼苗均成活的概率(10.24=3.2);(2)正常情况下梭梭树幼苗栽种5年后,其树杆地径服从正态分布N 250,52(单位:mm)梭梭树幼苗栽种5年后,若任意抽取一棵梭梭树,则树杆地径小于235mm的概率约为多少?(精确到0.001)为更好地监管梭梭树的生长情况,梭梭树幼苗栽种5年后,农林管理员随机抽取了10棵梭梭树,测得其树杆地径均小于235mm,农林管理员根据抽检结果,认为该地块土质对梭梭树的生长产生影响,计划整改地块并选择合适的肥料,试判
26、断该农林管理员的判断是否合理?并说明理由附:若随机变量Z服从正态分布N,2,则P-Z+0.6827,P-2Z+20.9545,P-3Z+30.997322243D打印即快速成型技术的一种,又称增材制造,它是一种以数字模型文件为基础,运用粉末状金属或塑料等可粘合材料,通过逐层打印的方式来构造物体的技术中国的3D打印技术在飞机上的应用已达到规模化、工程化,处于世界领先位置我国某企业利用3D打印技术生产飞机的某种零件,8月1日质检组从当天生产的零件中抽取了部分零件作为样本,检测每个零件的某项质量指标,得到下面的检测结果:质量指标6,77,88,99,1010,1111,1212,13频率0.020.
27、090.220.330.240.080.02(1)根据频率分布表,估计8月1日生产的该种零件的质量指标的平均值x和方差s2(同一组的数据用该组区间的中点值作代表);(2)由频率分布表可以认为,该种零件的质量指标XN,2,其中近似为样本平均数x,2近似为样本方差s2若P(Xa)=0.9772,求a的值;若8月1日该企业共生产了500件该种零件,问这500件零件中质量指标不少于7.06的件数最有可能是多少?附参考数据:6 2.45,若XN,2,则P(-X+)=0.6827,P(-2X+2)=0.9544,P(-3X+3)=0.99732325某校数学组老师为了解学生数学学科核心素养整体发展水平,组
28、织本校8000名学生进行针对性检测(检测分为初试和复试),并随机抽取了100名学生的初试成绩,绘制了频率分布直方图,如图所示(1)根据频率分布直方图,求样本平均数的估计值;(2)若所有学生的初试成绩X近似服从正态分布N,2,其中为样本平均数的估计值,14初试成绩不低于90分的学生才能参加复试,试估计能参加复试的人数;(3)复试共三道题,规定:全部答对获得一等奖;答对两道题获得二等奖;答对一道题获得三等奖;全部答错不获奖已知某学生进入了复试,他在复试中前两道题答对的概率均为a,第三道题答对的概率为b若他获得一等奖的概率为18,设他获得二等奖的概率为P,求P的最小值附:若随机变昰X服从正态分布N,
29、2,则P(-X+)0.6827,P(-2X+2)0.9545,P(-32.706,有90%的把握认为作品是否“优良”与制作者所处年级有关24月15日是全民国家安全教育日以人民安全为宗旨也是“总体国家安全观”的核心价值.只有人人参与,人人负责,国家安全才能真正获得巨大的人民性基础,作为知识群体的青年学生,是强国富民的中坚力量,他们的国家安全意识取向对国家安全尤为重要.某校社团随机抽取了600名学生,发放调查问卷600份(答卷卷面满分100分)回收有效答卷560份,其中男生答卷240份,女生答卷320份.有效答卷中75分及以上的男生答卷80份,女生答卷80份,其余答卷得分都在10分至74分之间同时
30、根据560份有效答卷的分数,绘制了如图所示的频率分布直方图(1)求频率分布直方图中m的值,并求出这560份有效答卷得分的中位数和平均数n(同一组数据用该组中点值代替).(2)如果把75分及以上称为对国家安全知识高敏感人群,74分及以下称为低敏感人群,请根据上述数据,完成下面22列联表,并判断能否有95%的把握认为学生性别与国家安全知识敏感度有关高敏感低敏感总计男生80女生80总计560附:独立性检验临界值表PK2k00.10.050.010.0050.001K22.7063.8416.6357.87910.828公式:K2=n ad-bc2a+bc+da+cb+d,其中n=a+b+c+d【答案
31、】(1)m=0.02,中位数62,平均数60.23(2)列联表见解析,有【详解】(1)因为10m=1-10 0.003+20.006+0.009+20.012+20.016,所以m=0.02又10(0.003+0.006+0.009+0.012+0.016)=0.463.841,故有95%的把握认为学生性别与国家安全知识敏感度有关3某学生兴趣小组随机调查了某市200天中每天的空气质量等级和当天到江滨公园锻炼的人次,整理数据得到下表(单位:天):锻炼人次空气质量等级0,200200,400400,6001(优)1220442(良)1519303(轻度污染)1616144(中度污染)752(1)分
32、别估计该市一天的空气质量等级为1,2,3,4的概率;并求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(2)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”根据所给数据,完成下面的22列联表,并根据列联表,判断是否有99.9的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?人次400人次400空气质量好空气质量不好附:K2=n ad-bc2a+bc+da+cb+d【答案】(1)0.38,0.32,0.23,0.07,340(2)列联表见解析,有【详解】(1)由频数分布表可知,该市一天的空气质
33、量等级为1的概率为12+20+44200=0.38,等级为2的概率为15+19+30200=0.32,等级为3的概率为16+16+14200=0.23,4等级为4的概率为7+5+2200=0.07,由频数分布表可知,一天中到该公园锻炼的人次的平均数为10050+30060+50090200=340.(2)22列联表如下:人次400人次400空气质量好6674空气质量不好4416K2=200(6616-7444)2110901406011.64010.828,因此,有99.9%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关4某市阅读研究小组为了解该城市中学生阅读与语文成绩的关系,在参
34、加市中学生语文综合能力竞赛的各校学生中随机抽取了500人进行调查,并按学生成绩是否高于75分(满分100分)及周平均阅读时间是否少于10小时,将调查结果整理成列联表.现统计出成绩不低于75分的样本占样本总数的30%,周平均阅读时间少于10小时的人数占样本总数的一半,而不低于75分且周平均阅读时间不少于10小时的样本有100人.周平均阅读时间少于10小时周平均阅读时间不少于10小时合计75分以下s不低于75分t100合计500(1)根据所给数据,求出表格中s和t的值,并分析能否有99.9%以上的把握认为语文成绩与阅读时间是否有关;(2)先从成绩不低于75分的样本中按周平均阅读时间是否少于10小时
35、分层抽样抽取9人进一步做问卷调查,然后从这9人中再随机抽取3人进行访谈,记抽取3人中周平均阅读时间不少于10小时的人数为X,求X的分布列与均值.参考公式及数据:2=n(ad-bc)2a+bc+da+cb+d,n=a+b+c+d.0.010.0050.001x6.6357.87910.828【答案】(1)s=150,t=50,有99.9%的把握认为语文成绩与阅读时间有关(2)分布列见解析,数学期望为2【详解】(1)根据已知条件,列联表如下:周平均阅读时间少于10小时周平均阅读时间不少于10小时合计75分以下200150350不低于75分50100150合计2502505005所以s=150,t=
36、50,由表知2=500(200100-15050)235015025025023.810.828,所以有99.9%的把握认为语文成绩与阅读时间有关.(2)依题意,成绩不低于75分的学生中周平均阅读时间少于10小时和不少于10小时的人数比是1:2,按分层抽样抽取9人,则周平均阅读时间少于10小时有3人,不少于10小时的有6人,从这9人中再随机抽取3人进行访谈,则X可能的取值为0,1,2,3,P X=0=C33C39=184,P X=1=C23C16C39=314,P X=2=C13C26C39=1528,P X=3=C36C39=521.分布列如下:X0123P1843141528521E X=
37、1314+21528+3521=2.5一个航空航天的兴趣小组,对500名男生和500名女生关于航空航天是否感兴趣的话题进行统计,情况如下表所示男生女生感兴趣380220不感兴趣120280P(K2k)0.0500.0250.0100.0050.001k3.8415.0246.6357.87910.828附:K2=n ad-bc2a+bc+da+cb+d,n=a+b+c+d(1)是否有99.9%的把握认为对航空航天感兴趣的情况与性别相关联?(2)一名兴趣小组成员在试验桌上进行两艘飞行器模型间的“交会对接”游戏,左边有2艘“Q2运输船”和1艘“M1转移塔”,右边有3艘“M1转移塔”假设两艘飞行器模
38、型间的“交会对接”重复了n次,记左边剩余2艘“Q2运输船”的概率为Pn,剩余1艘“Q2运输船”的概率为qn,求2pn+qn与2pn-1+qn-1的递推关系式;(3)在(2)情况下,求Xn的分布列与数学期望E Xn【答案】(1)有99.9%的把握认为对航空航天感兴趣的情况与性别相关联(2)2pn+qn-1=132pn-1+qn-1-1(3)分布列见解析,E Xn=1+13n,nN*【详解】(1)解:K2=1000 380280-1202202500500600400106.6710.828有99.9%的把握认为对航空航天感兴趣的情况与性别相关联(2)p1=C11C13C13C13=13,q1=C
39、12C13C13C13=23,6p2=C11C13C13C13p1+C12C13C13C13q1+0 1-p1-q1=13p1+29q1=727,q2=C12C13C13C13p1+C12C13C12C13+C11C13C11C13q1+C13C13C12C13 1-p1-q1=-19q1+23=1627当n2时pn=C11C13C13C13pn-1+C12C13C11C13qn-1+0 1-pn-1-qn-1=13pn-1+29qn-1,qn=C12C13C13C13pn-1+C12C13C12C13+C11C13C11C13qn-1+C13C13C12C13 1-pn-1-qn-1=-19
40、qn-1+23,2+,得2pn+qn=23pn-1+49qn-1-19qn-1+23=132pn-1+qn-1+23从而2pn+qn-1=132pn-1+qn-1-1(3)由(2)得2p1+q1-1=13,2pn+qn-1=132pn-1+qn-1-1,数列 2pn+qn-1是首项为13,公比为13的等比数列,2pn+qn-1=1313n-1=13n,即2pn+qn=1+13n,nN*,联立得qn-35=-19qn-1-35,又q1-35=115,则数列 qn-35 是首项为115,公比为-19的等比数列,qn=115-19n-1+35,nN*由得pn=121+13n-qn=310-19n+1
41、213n+15,nN*1-pn-qn=310-19n-1213n+15,nN*Xn的概率分布列为:Xn012P1-pn-qnqnpn则E Xn=0 1-pn-qn+1qn+2pn=1+13n,nN*类型类型2 2:线性回归线性回归及及非线性回归问题非线性回归问题线性回归线性回归线性回归是研究不具备确定的函数关系的两个变量之间的关系(相关关系)的方法对于一组具有线性相关关系的数据(x1,y1),(x2,y2),(xn,yn),其回归方程y=bx+a的求法为b=ni=1(xi-x)(yi-y)ni=1(xi-x)2=ni=1xiyi-nxyni=1xi2-nx2a=y-bx其中,x=1nni=1x
42、i,y=1nni=1yi,(x,y)称为样本点的中心非线性回归非线性回归建立非线性回归模型的基本步骤(1)确定研究对象,明确哪个是解释变量,哪个是预报变量;(2)画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(是否存在非线性关系);(3)由经验确定非线性回归方程的类型(如我们观察到数据呈非线性关系,一般选用反比例函数、二次函数、7指数函数、对数函数、幂函数模型等);(4)通过换元,将非线性回归方程模型转化为线性回归方程模型;(5)按照公式计算线性回归方程中的参数(如最小二乘法),得到线性回归方程;(6)消去新元,得到非线性回归方程;(7)得出结果后分析残差图是否有异常若存在异常,则
43、检查数据是否有误,或模型是否合适等线性回归线性回归及及非线性回归问题专项训练非线性回归问题专项训练6某旅游公司针对旅游复苏设计了一款文创产品来提高收益该公司统计了今年以来这款文创产品定价x(单位:元)与销量y(单位:万件)的数据如下表所示:产品定价x(单位:元)99.51010.511销量y(单位:万件)1110865(1)依据表中给出的数据,判断是否可用线性回归模型拟合y与x的关系,请计算相关系数并加以说明(计算结果精确到0.01);(2)建立y关于x的回归方程,预测当产品定价为8.5元时,销量可达到多少万件参考公式:r=ni=1xi-xyi-yni=1xi-x2ni=1yi-y2,b=ni
44、=1xi-xyi-yni=1xi-x2,a=y-bx参考数据:65 8.06【答案】(1)r-0.99,说明y与x的线性相关性很强,可以用线性回归模型拟合y与x的关系(2)12.8万件【详解】(1)由题条件得x=15(9+9.5+10+10.5+11)=10,y=15(11+10+8+6+5)=85i=1xi-xyi-y=(9-10)(11-8)+(9.5-10)(10-8)+(10-10)(8-8)+(10.5-10)(6-8)+(11-10)(5-8)=-8,5i=1xi-x2=(9-10)2+(9.5-10)2+(10-10)2+(10.5-10)2+(11-10)2=2.5,5i=1y
45、i-y2=(11-8)2+(10-8)2+(8-8)2+(6-8)2+(5-8)2=26r=ni=1xi-xyi-yni=1xi-x2ni=1yi-y2=-865-0.99y与x的相关系数近似为-0.99,说明y与x的线性相关性很强,从而可以用线性回归模型拟合y与x的关系(2)b=5i=1xi-xyi-y5i=1xi-x2=-82.5=-3.2,a=y+3.2x=40,y关于x的线性回归方程为y=-3.2x+408当x=8.5时,y=12.8当产品定价为8.5元时,预测销量可达到12.8万件72023年,国家不断加大对科技创新的支持力度,极大鼓舞了企业投入研发的信心,增强了企业的创新动能.某企
46、业在国家一系列优惠政策的大力扶持下,通过技术革新和能力提升,极大提升了企业的影响力和市场知名度,订单数量节节攀升,右表为该企业今年14月份接到的订单数量.月份t1234订单数量y(万件)5.25.35.75.8附:相关系数,r=ni=1(xi-x)(yi-y)ni=1(xi-x)2ni=1(yi-y)2回归方程y=a+bx中斜率和截距的最小二乘法估计公式分别为b=ni=1(xi-x)(yi-y)ni=1(xi-x)2,a=y-bx,1.3 1.14.(1)试根据样本相关系数r的值判断订单数量y与月份t的线性相关性强弱(0.75|r|1,则认为y与t的线性相关性较强,|r|0.75,订单数量y与
47、月份t的线性相关性较强;(2)b=4i=1(ti-t)(yi-y)4i=1(ti-t)2=1.15=0.22,a=y-bt=5.5-0.222.5=4.95,线性回归方程为y=0.22t+4.95,9令t=5,y=0.225+4.95=6.05(万件),即该企业5月份接到的订单数量预计为6.05万件.8据统计,某城市居民年收入(所有居民在一年内收入的总和,单位:亿元)与某类商品销售额(单位:亿元)的10年数据如下表所示:第n年12345678910居民年收入x32.231.132.935.737.138.039.043.044.646.0商品销售额y25.030.034.037.039.041
48、.042.044.048.051.0依据表格数据,得到下面一些统计量的值.10i=1xi10i=1yii=110 xi-x2i=110yi-y2i=110 xi-xyi-y379.6391247.624568.9m(1)根据表中数据,得到样本相关系数r0.95.以此推断,y与x的线性相关程度是否很强?(2)根据统计量的值与样本相关系数r0.95,建立y关于x的经验回归方程(系数精确到0.01);(3)根据(2)的经验回归方程,计算第1个样本点 32.2,25.0对应的残差(精确到0.01);并判断若剔除这个样本点再进行回归分析,b的值将变大还是变小?(不必说明理由,直接判断即可).附:样本 x
49、i,yii=1,2,n的相关系数r=ni=1xi-xyi-yni=1xi-x2ni=1yi-y2,2.297 1.516,b=ni=1xi-xyi-yni=1xi-x2,a=y-bx.【答案】(1)线性相关程度很强(2)y=1.44x-15.56(3)-5.81,变小【详解】(1)根据样本相关系数r0.95,可以推断线性相关程度很强.(2)由r=ni=1xi-xyi-yni=1xi-x2ni=1yi-y20.95及b=ni=1xi-xyi-yni=1xi-x2,可得br=ni=1xi-x2ni=1yi-y2ni=1xi-x2=ni=1yi-y2ni=1xi-x22.297,所以b=r 2.29
50、7 0.951.5161.440,又因为x=37.96,y=39.1,所以a=y-bx-15.56,所以y与x的线性回归方程y=1.44x-15.56.(3)第一个样本点 32.2,25.0的残差为:25.0-1.4432.2-15.56=-5.808-5.81,10由于该点在回归直线的左下方,故将其剔除后,b的值将变小.9数据显示中国车载音乐已步入快速发展期,随着车载音乐的商业化模式进一步完善,市场将持续扩大,下表为2018-2022年中国车载音乐市场规模(单位:十亿元),其中年份2018-2022对应的代码分别为1-5年份代码x12345车载音乐市场规模y2.83.97.312.017.0