《备战2023年高考数学二轮专题复习概率与统计.docx》由会员分享,可在线阅读,更多相关《备战2023年高考数学二轮专题复习概率与统计.docx(74页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第四板块|概率与统计评价诊断1(2022潍坊期末)某类共享单车密码锁的密码是由4位数字组成,所有密码中,恰有三个重复数字的密码个数为( )A90 B324 C360 D400解析:选C根据题意,四个位置上恰有三个重复数字,可分两步完成,第一步从10个数字中任选一个安排在三个位置上,共有CC40(种)情况,第二步在剩下的9个数字中任选一个安排在剩下的那个位置上,有9种情况,故共有409360 种,即密码个数为360.2(2022新高考卷)甲、乙、丙、丁、戊5名同学站成一排参加文艺汇演,若甲不站在两端,丙和丁相邻,则不同的排列方式共有( )A12种 B24种 C36种 D48种解析:选B先将丙和丁
2、捆在一起有A种排列方式,然后将其与乙、戊排列,有A种排列方式,最后将甲插入中间两空,有C种排列方式,所以不同的排列方式共有AAC24种,故选B.3(2022郑州质检)为了落实五育并举,全面发展学生素质,学校准备组建书法、音乐、美术、体育社团,现将5名同学分配到这4个社团进行培训,每名同学只分配到1个社团,每个社团至少分配1名同学,则不同的分配方案共有( )A60种 B120种 C240种 D480种解析:选C由题意,分两步完成,第一步,将5名同学按1,1,1,2分成4组,有种分组方法;第二步,将分成的4组学生安置在4个社团,有A种方法,由分步乘法计数原理得,共有A240(种)不同的分配方案4(
3、2022岳阳质监)有唱歌、跳舞、小品、杂技、相声五个节目制成一个节目单,其中小品、相声不相邻且相声、跳舞相邻的节目单有_种(结果用数字作答)解析:先考虑相声、跳舞相邻的情况,只需将相声、跳舞这两个节目进行捆绑,形成一个大元素,然后再将这个“大元素”与其他三个节目进行排序,共有AA48(种)排法接下来考虑相声节目与小品、跳舞都相邻的情形,需将相声与小品、跳舞这三个节目进行捆绑,其中相声节目位于中间,然后将这个“大元素”与其他两个节目进行排序,此时共有AA12(种)排法综上所述,由间接法可知,共有481236种不同的排法答案:36扫盲补短知识盲点解排列组合问题的关键是搞清是否与顺序有关,分清先选后
4、排,分类还是分步方法疑点整体均分与不等分组的区别:对于不等分组,只需先分组,后排列,注意分组时,任何组中元素的个数都不相等,所以不需要除以全排列数对于整体均分,解题时要注意分组后,不管它们的顺序如何,都是一种情况,所以分组后一定要除以A(n为均分的组数),避免重复计数思想高点解决排列组合问题时,常用到正难则反,分类讨论的思想评价诊断1二项式10的展开式中的常数项为( )A210 B210 C252 D252解析:选A二项式10的展开式的通项为Tk1C()10kk(1)kC,(k0,1,2,10)令0,得k6,所以常数项为T7(1)6C210.2(2022北京高考)若(2x1)4a4x4a3x3
5、a2x2a1xa0,则a0a2a4( )A40 B41 C40 D41解析:选B法一:依题意,令x1,可得1a4a3a2a1a0,令x1,可得81a4a3a2a1a0,以上两式相加可得822(a4a2a0),所以a0a2a441,故选B.法二:二项式(2x1)4的展开式的通项为Tr1C(2x)4r(1)r,分别令r4,2,0,可分别得a01,a224,a416,所以a0a2a441,故选B.3(2022新高考卷)(xy)8的展开式中x2y6的系数为_(用数字作答)解析:(xy)8展开式的通项Tr1Cx8ryr,r0,1,7,8.令r6,得T61Cx2y6,令r5,得T51Cx3y5,所以(xy
6、)8的展开式中x2y6的系数为CC28.答案:284(2022沈阳一模)若n展开式的二项式系数之和为64,则展开式中x3项的系数为_(用数字作答)解析:由题意知,二项式系数之和2n64n6,所以Tr1C(2x)6r(x2)r(1)r26rCx63r.令63r3r1,所求x3项的系数为261C192.答案:1925已知6(a0)的展开式中常数项为240,则(xa)(x2a)2的展开式中x2项的系数为_解析:6的展开式的通项Tr1Cx6rrCar,令60,解得r4,则其常数项为Cx2415a4240,则a416.由a0,故a2,又(xa)(x2a)2x(x2a)2a(x2a)2x33ax24a3的
7、展开式中,x2项为3ax2.故x2项的系数为(3)26.答案:6扫盲补短知识盲点二项展开式记忆不牢,a,b的顺序颠倒,升幂、降幂颠倒,二项式系数与二项式展开式中项的系数的概念掌握不清方法疑点特殊值的代入及构造特定结构的二项展开式评价诊断1某超市计划按月订购一种冷饮,根据往年销售经验,每天需求量与当天最高气温(单位:)有关如果最高气温不低于25 ,需求量为600瓶;如果最高气温位于区间20 ,25 ),需求量为300瓶;如果最高气温低于20 ,需求量为100瓶为了确定6月份的订购计划,统计了前三年6月份各天的最高气温数据,得到下面的频数分布表:最高气温15,20)20,25)25,30)30,3
8、5)35,40)天数45253818以最高气温位于各区间的频率估计最高气温位于该区间的概率若6月份这种冷饮一天的需求量不超过x瓶的概率估计值为0.1,则x( )A100 B300 C400 D600解析:选B由表格数据知,最高气温低于25 的频率为0.1,所以6月份这种冷饮一天的需求量不超过300瓶的概率估计值为0.1.故选B.2某国计划采购疫苗,现在成熟的疫苗中,三种来自中国,一种来自美国,一种来自英国,一种由美国和德国共同研发,从这6种疫苗中随机采购三种,若采购每种疫苗都是等可能的,则买到中国疫苗的概率为( )A. B C. D解析:选D没有买到中国疫苗的概率为P1,所以买到中国疫苗的概率
9、为P1P1.故选D.3(2022新高考卷)从2至8的7个整数中随机取2个不同的数,则这2个数互质的概率为( )A. B C. D解析:选D从7个整数中随机取2个不同的数,共有C21(种)取法,取得的2个数互质的情况有2,3,2,5,2,7,3,4,3,5,3,7,3,8,4,5,4,7,5,6,5,7,5,8,6,7,7,8,共14种,根据古典概型的概率公式,得这2个数互质的概率为.故选D.42022年2月冬奥会在北京召开,“三亿人参与冰雪运动”的愿景,正在亿万国人逐渐高涨的运动热情中走向现实小明爱上了冰壶运动,在自己家附近的冰面上和父亲一起制作了简易冰壶场地,得分区是四个半径不等的同心圆,由
10、内而外称为A,B,C,D.小明每次投掷都能使得冰壶进入得分区,若每次投掷后冰壶进入A,B,C,D区的概率分别为0.01,0.1,0.3,0.59,小明投掷两个冰壶,两次投掷互不影响,则有一个冰壶进入A或C区,另一个冰壶进入B或D区的概率为( )A1 B0.213 9C0.427 8 D0.195 8解析:选C投掷一个冰壶进入A或C区的概率为0.010.30.31,投掷一个冰壶进入B或D区的概率为0.10.590.69,小明投掷两个冰壶,则有一个冰壶进入A或C区,另一个冰壶进入B或D区的概率为PC0.310.690.427 8.扫盲补短知识盲点(1)古典概型中分清基本事件个数n与事件A中所包含的
11、基本事件的个数;(2)掌握概率与频率的区别思想高点求概率时常用到对立事件的概率,注意正难则反即转化思想的应用评价诊断1.(多选)某高中为了了解本校学生考入大学一年后的学习情况,对本校上一年考入大学的同学进行了调查,根据学生所属的专业类型,制成饼图,现从这些同学中抽出100人进行进一步调查,已知张三为理学专业,李四为工学专业,则下列说法正确的是( )A若按专业类型进行分层随机抽样,则张三被抽到的可能性比李四大B若按专业类型进行分层随机抽样,则理学专业和工学专业应抽取30人和20人C采用分层随机抽样比简单随机抽样更合理D该问题中的样本容量为100解析:选BCD对于选项A,张三与李四被抽到的可能性一
12、样大,故A错误;对于选项B,理学专业应抽取的人数为10030,工学专业应抽取的人数为10020,故B正确;对于选项C,因为各专业差异比较大,所以采用分层随机抽样更合理,故C正确;对于选项D,该问题中的样本容量为100,故D正确2在高一入学时,某班班委统计了本班所有同学中考体育成绩的平均分和方差后来又转学来一位同学若该同学中考体育的成绩恰好等于这个班级原来的平均分,则下列说法正确的是( )A班级平均分不变,方差变小B班级平均分不变,方差变大C班级平均分改变,方差变小D班级平均分改变,方差变大解析:选A设该班原有n个学生,平均分为,方差为s2,则,s2(x1)2(x2)2(xn)2,故x1x2xn
13、n,(x1)2(x2)2(xn)2ns2,则转来一位同学后的平均分为,方差为(x1)2(x2)2(xn)2()2s2.故班级平均分不变,方差变小3(多选)某学校开展了针对学生使用手机问题的专项治理,效果显著,现随机抽取该校100名学生,调查他们周六使用手机的时间(单位:min),数据按照0,25),25,50),125,150分组,得到如图的频率分布直方图,则( )A这100名学生中,有25名学生周六使用手机的时间在75,100)内B估计这100名学生中,周六使用手机的平均时间约为50 minC估计这100名学生中,周六使用手机时间的第60百分位数约为80D估计该校周六使用手机时间超过2 h的
14、学生比例为10%解析:选AC根据频率分布直方图得25a125(0.0040.00620.0120.002)0.25,解得a0.01,周六使用手机的时间在75,100)内的频率为25a0.25,故有25名同学,故A正确;周六使用手机的平均时间约为2571.25,故B错误;周六使用手机时间在0,75)内的频率为25(0.0040.0060.012)0.55,所以第60百分位数约为752580,故C正确;周六使用手机时间在100,125)内的频率为0.15,使用手机时间在125,150内的频率为0.05,所以周六使用手机时间超过2 h的学生频率为0.006250.050.08,故D错误4(2022全
15、国甲卷)某社区通过公益讲座以普及社区居民的垃圾分类知识为了解讲座效果,随机抽取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民在讲座前和讲座后问卷答题的正确率如图,则( )A讲座前问卷答题的正确率的中位数小于70%B讲座后问卷答题的正确率的平均数大于85%C讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差D讲座后问卷答题的正确率的极差大于讲座前正确率的极差解析:选B对于A,讲座前问卷答题的正确率的中位数是72.5%,所以A错误;对于B,讲座后问卷答题的正确率只有1个80%,4个85%,剩下全部大于等于90%,其平均数显然大于85%,所以B正确;对于C,由
16、题图可知,讲座前问卷答题的正确率波动较大,讲座后问卷答题的正确率波动较小,所以讲座前问卷答题的正确率的标准差大于讲座后问卷答题的正确率的标准差,所以C错误;对于D,讲座前问卷答题的正确率的极差是95%60%35%,讲座后问卷答题的正确率的极差是100%80%20%,所以讲座前问卷答题的正确率的极差大于讲座后问卷答题的正确率的极差,所以D错误故选B.扫盲补短知识盲点(1)频率分布直方图的纵坐标是而不是频率;(2)若x1,x2,x3,xn的平均数为,方差为s2,则ax1b,ax2b,ax3b,axnb的平均数为ab,方差为a2s2思维难点在频率分布直方图中,要准确定位“三数”众数:最高小长方形底边
17、中点的横坐标;中位数:平分频率分布直方图的面积且垂直于横轴的直线与横轴交点的横坐标;平均数:频率分布直方图中每个小长方形的面积乘小长方形底边中点的横坐标之和思想高点在解决统计图表的相关问题中,需准确审图,体现数形结合思想的应用课时验收评价基础性考法满分练1将某市参加高中数学建模竞赛的学生成绩分成5组:50,60),60,70),70,80),80,90),90,100),并整理得到频率分布直方图(如图所示)现按成绩运用分层随机抽样的方法抽取100位同学进行学习方法的问卷调查,则成绩在区间70,80)内应抽取的人数为( )A10 B20 C30 D35解析:选D依题意70,80)中的频率为0.0
18、35100.35,所以70,80)中应抽取0.3510035(人)故选D.2(2022石家庄质检)已知(12x)n的展开式中第4项与第6项的二项式系数相等,则(12x)n的展开式的各项系数之和为( )A38 B310 C28 D210解析:选A由题知CC,由组合数性质解得n8,所以(12x)n(12x)8,令x1,得展开式各项系数之和为38.故选A.32016年11月30日,二十四节气被正式列入联合国教科文组织人类非物质文化遗产代表作名录某小学三年级共有学生500名,随机抽查100名学生并提问二十四节气歌,只能说出两句的有45人,能说出三句及以上的有32人,据此估计该校三年级的500名学生中,
19、对二十四节气歌只能说出一句或一句也说不出的有( )A69人 B84人 C108人 D115人解析:选D由题意,随机抽查的100名学生中,只能说出一句或一句也说不出的学生有100453223(人),所以只能说出一句或一句也说不出的学生占的比例为,估计该校三年级的500名学生中,只能说出一句或一句也说不出的学生共有500115(人)4甲、乙两人在5天中每天加工零件的个数用茎叶图表示如图,中间一列的数字表示零件个数的十位数,两边的数字表示零件个数的个位数,则下列结论正确的是( )A在这5天中,甲、乙两人加工零件数的极差相同B在这5天中,甲、乙两人加工零件数的中位数相同C在这5天中,甲日均加工零件数大
20、于乙日均加工零件数D在这5天中,甲加工零件数的方差小于乙加工零件数的方差解析:选C甲在5天中每天加工零件的个数为18,19,23,27,28;乙在5天中每天加工零件的个数为17,19,21,23,25.对于A,甲加工零件数的极差为281810,乙加工零件数的极差为25178,故A错误;对于B,甲加工零件数的中位数为23,乙加工零件数的中位数为21,故B错误;对于C,甲加工零件数的平均数为23,乙加工零件数的平均数为21,故C正确;对于D,甲加工零件数的方差为16.4,乙加工零件数的方差为8,故D错误故选C.5(2022沈阳一模)(多选)某团队共有20人,他们的年龄分布如下表所示,年龄28293
21、032364045人数1335431有关这20人年龄的众数、极差、百分位数说法正确的有( )A众数是32 B众数是5C极差是17 D25%分位数是30解析:选ACD年龄为32的有5人,故众数是32,A正确,B错误;452817,极差为17,C正确;因为2025%5,所以230,故25%分位数是30,D正确6已知文印室内有5份待打印的文件自上而下摞在一起,秘书小王要在这5份文件中再插入甲、乙两份文件,甲文件要在乙文件前打印,且不改变原来次序,则不同的打印方式的种数为( )A15 B21 C28 D36解析:选B可理解为从7个空位中选择两个空位排甲、乙两份文件(甲文件在乙文件前),其余5个空位按之
22、前的顺序排其他5个文件,由组合计数原理可知,不同的打印方式的种数为C21.故选B.7(2022湖北七市(州)调研)某学校高一年级、高二年级、高三年级的人数分别为1 600,1 100,800,现用分层随机抽样的方法从高一年级、高二年级、高三年级抽取一个学生样本测量学生的身高如果在这个样本中,有高一年级学生32人,且测得高一年级、高二年级、高三年级学生的平均身高分别为160 cm,165 cm,170 cm.则下列说法正确的是( )A高三年级抽取的学生数为32人B高二年级每个学生被抽取到的概率为C所有年级中,高一年级每个学生被抽取到的概率最大D所有学生的平均身高估计要小于165 cm解析:选D根
23、据分层随机抽样的定义,高三抽取的学生数为3216,A错误;分层随机抽样中每个个体被抽取的概率相等,均为,B、C错误;平均身高为160165170163.9(cm),D正确8(2022怀仁模拟)为保障妇女权益、促进妇女发展、推动男女平等,我国积极推动和支持妇女参政议政,妇女参与决策和管理的比例明显提高,妇女的政治权利得到有力保障和加强.2018年召开的第十三届全国人民代表大会共有女代表742名,政协第十三届(2018年)全国委员会中有女委员440人第一到十三届历届全国人大女代表、政协女委员所占比重如图:下列结论错误的是( )A第十三届全国人大女代表所占比重比第十一届提高3.6个百分点B第十三届全
24、国政协女委员所占比重比第四届提高10个百分点以上C从第一到第十三届全国政协女委员所占比重的平均值低于12%D第十三届全国人大代表的人数不高于3 000人解析:选C第十三届全国人大女代表所占比重为24.9%,第十一届为21.3%,提高3.6个百分点,A正确;第十三届全国政协女委员所占比重为20.4%,第四届为9%,提高11.4个百分点,B正确;从第一到第十三届全国政协女委员所占比重的平均值为(6.711.48.19.013.112.813.913.715.516.717.717.820.4)%13.6%,高于12%,C错误;第十三届全国人大代表的人数约为2 980人,不高于3 000人,D正确故
25、选C.9人类通常有O,A,B,AB四种血型,某一血型的人能给哪些血型的人输血,是有严格规定的,输血法则可归结为4条:XX;OX;XAB;不满足上述3条法则的任何关系式都是错误的(其中X代表O,A,B,AB中某种血型,箭头左边表示供血者,右边表示受血者)已知我国O,A,B,AB四种血型的人数所占比例分别为41%,28%,24%,7%,在临床上,按照规则,若受血者为A型血,则一位供血者不能为这位受血者正确输血的概率为( )A0.27 B0.31 C0.42 D0.69解析:选B当受血者为A型血时,供血者可以为A型或O型,即B,AB两种血型不能为供血者,我国O,A,B,AB四种血型的人数所占比例分别
26、为41%,28%,24%,7%,所以一位供血者不能为这位受血者正确输血的概率为P24%7%31%0.31.故选B.10甲、乙两工厂生产某种产品,抽取连续5个月的产品生产产量(单位:件)情况如下:甲:80,70,100,50,90;乙:60,70,80,55,95,则下列说法正确的是( )A甲平均产量高,甲产量稳定B甲平均产量高,乙产量稳定C乙平均产量高,甲产量稳定D乙平均产量高,乙产量稳定解析:选B对于甲,可得平均数78,方差s(8078)2(7078)2(10078)2(5078)2(9078)2296.同理,对于乙,可得平均数72,方差s206,7872,296206,甲平均产量高,乙产量
27、稳定故选B.11(多选)在某市高三年级举行的一次模拟考试中,某学科共有20 000人参加考试为了了解本次考试学生成绩情况,从中抽取了部分学生的成绩(成绩均为正整数,满分为100分)作为样本进行统计,样本容量为n.按照50,60),60,70),70,80),80,90),90,100的分组作出频率分布直方图如图所示其中,成绩落在区间50,60)内的人数为16.则下列结论正确的是( )A样本容量n1 000B图中x0.030C估计该市全体学生成绩的平均分为70.6分D该市要对成绩由高到低前20%的学生授予“优秀学生”称号,则成绩为78分的学生肯定能得到此称号解析:选BC对于A,因为成绩落在区间5
28、0,60)内的人数为16,所以样本容量n100,故A不正确;对于B,因为(0.016x0.0400.0100.004)101,解得x0.030,故B正确;对于C,学生成绩平均分为0.01610550.03010650.04010750.01010850.004109570.6,故C正确;对于D,因为10(0.0040.010)(8078)0.0400.220.20,即按照成绩由高到低前20%的学生中不含78分的学生,所以成绩为78分的学生不能得到此称号,故D不正确故选B、C.12某高校中文系为了解本校学生每天的课外阅读情况,随机选取了200名学生进行调查,其中女生有120人根据调查结果绘制了如
29、下学生日均课外阅读时间(单位:分钟)的频数分布表.分组(时间:分钟)频数频率0,10)500.2510,20)200.120,30)500.2530,40)600.340,50)120.0650,6080.04将日均课外阅读时间在30,60内的学生评价为“课外阅读时间合格”,已知样本中“课外阅读时间合格”的学生中有20名男生那么下列说法正确的是( )A该校学生“课外阅读时间”的平均值约为26分钟B按分层随机抽样的方法,从样本中“课外阅读时间不合格”的学生抽取10人,再从这10人中随机抽取2人,则这2人恰好是一男一女的概率为C样本学生“课外阅读时间”的中位数为24分钟D若该校有10 000名学生
30、,估计“课外阅读时间合格”的女生有3 500人解析:选B50.25150.1250.25350.3450.06550.0426,A错误;合格的学生有80人,其中男生20人,女生60人,不合格的学生有120人,其中男生60人,女生60人,在不合格的学生中分层随机抽样抽10人,则男生5人,女生5人,10人中任取两人为一男一女的概率为P,B正确;设中位数为x,则0.250.10.250.5,解得x2624,C错误;课外阅读合格女生所占全体学生的概率P,10 0003 000人,D错误13某品牌家电公司从其全部200名销售员工中随机抽出50名调查销售情况,销售额都在区间5,25(单位:百万元)内,将其
31、分成5组:5,9),9,13),13,17),17,21),21,25,并整理得到如下的频率分布直方图,下列说法正确的是( )A频率分布直方图中a的值为0.06B估计全部销售员工销售额的中位数为15C估计全部销售员工中销售额在区间9,13)内有64人D估计全部销售员工销售额的第75百分位数为17解析:选C由频率分布直方图可得(0.02a0.090.030.03)41,解得a0.08,故A错误;所以估计其全部销售员工中销售额在区间9,13)内的人数为0.08420064(人),故C正确;设中位数为x,则(0.020.08)4(x13)0.090.5,解得x14,故B错误;因为(0.020.080
32、.09)40.76,故17为第76百分位数,故D错误14(2022深圳六校联考)一部记录片在4个不同的场地轮映,每个场地放映一次,则有_种轮映次序解析:由题意,不同的轮映次序即四个场地的全排列,方法数为A24.答案:2415(2022全国乙卷)从甲、乙等5名同学中随机选3名参加社区服务工作,则甲、乙都入选的概率为_解析:甲、乙等5名同学分别标记为a1,a2,a3,a4,a5,其中甲标记为a1,乙标记为a2.从中随机选3名参加社区服务工作的事件有a1,a2,a3,a1,a2,a4,a1,a2,a5,a2,a3,a4,a2,a3,a5,a3,a4,a5,a1,a3,a4,a1,a3,a5,a2,a
33、4,a5,a1,a4,a5,共计10种甲、乙都入选的事件有a1,a2,a3,a1,a2,a4,a1,a2,a5,共计3种,故所求概率P.答案:16(2022常德期末)(2x2)5展开式中的常数项是_解析:因为(2x2)525x25,5展开式的通项为Tr1CrC(1)rxr,令r0,得r0,令r2,得r2,因此,(2x2)5展开式中的常数项是2CC12.答案:1217(2022莆田质检)如图,杨辉三角最早出现于我国南宋数学家杨辉1261年所著的详解九章算法它揭示了(ab)n(n为非负整数)展开式的项数及各项系数的有关规律由此可得图中第9行从左到右数第5个数是_,第9行排在奇数位置的所有数字之和为
34、_解析:由题意得,第0行有1个数,为1,第1行有2个数,依次是C,C,第2行有3个数,依次是C,C,C,则第9行有10个数,其中第5个数为C126.第9行排在奇数位置的所有数字之和为CCCC291256.答案:126256微专题(一)统计与成对数据的统计分析命题点(一)用样本估计总体典例从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:质量指标值分组75,85)85,95)95,105)105,115)115,125)频数62638228(1)根据上表补全如图所示的频率分布直方图;(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间
35、的中点值作代表);(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定?解(1)补全后的频率分布直方图如图所示(2)质量指标值的样本平均数为800.06900.261000.381100.221200.08100.质量指标值的样本方差为s2(20)20.06(10)20.26020.381020.222020.08104.所以这种产品质量指标值的平均数约为100,方差约为104.(3)质量指标值不低于95的产品所占比例约为0.380.220.080.68.由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不
36、低于95的产品至少要占全部产品的80%”的规定方法技巧利用样本的数字特征解决优化决策问题的依据(1)平均数反映了数据取值的平均水平;标准差、方差描述了一组数据围绕平均数波动的大小标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定(2)用样本估计总体就是利用样本的数字特征来描述总体的数字特征针对训练为了比较两种复合材料制造的轴承(分别称为类型轴承和类型轴承)的使用寿命,检验了两种类型轴承各30个,它们的使用寿命(单位:百万圈)如下表:类型6.26.48.38.69.49.810.310.611.211.411.611.611.711.811.812.21
37、2.312.312.512.512.612.712.813.313.313.413.613.814.214.5类型8.48.58.79.29.29.59.79.79.89.810.110.210.310.310.410.610.810.911.211.211.311.511.511.611.812.312.412.713.113.4根据上述表中的数据回答下列问题:(1)对于类型轴承,应该用平均数还是中位数度量其寿命分布的中心?说明理由;(2)若需要使用寿命尽可能大的轴承,从中位数或平均数的角度判断,应选哪种轴承?说明理由;(3)若需要使用寿命的波动性尽可能小的轴承,应选哪种轴承?说明理由解:(
38、1)从表中可以看出类型轴承大多数的数据集中在11.2,13.8区间内,在这个区间的数据有20个,中位数为12,6.2,6.4有严重的偏离,所以使用中位数度量寿命分布的中心(2)由上表可知,类型轴承的使用寿命按由小到大排序,排在15,16位是11.8,12.2,故中位数为12;类型轴承的使用寿命按由小到大排序,排在15,16位是10.4,10.6,故中位数为10.5,因为1210.5,所以应选类型轴承(3)从类型的表格中,极差14.56.28.3,多数的数据集中在11.2,13.8区间内,6.2,6.4,8.3,8.6严重偏离分布中心,即波动较大,标准差必定较大,从类型的表格中,极差13.48.
39、45,数据的分布集中均匀,即波动较小,标准差必定较小,故应选类型轴承命题点(二)一元线性回归模型及其应用典例某公司对某产品作市场调查,获得了该产品的定价x(单位:万元/吨)和一天的销量y(单位:吨)的一组数据,根据这组数据制作了如下统计表和散点图iyiiyi0.331030.16410068350表中t.(1)根据散点图判断,x与cx1d哪一个更适合作为y关于x的经验回归方程;(给出判断即可,不必说明理由)(2)根据(1)的判断结果,建立y关于x的经验回归方程;(3)若生产1吨该产品的成本为0.25万元,依据(2)的经验回归方程,预计每吨定价多少时,该产品一天的销售利润最大?最大利润是多少?附
40、:经验回归方程x中,.解(1)根据散点图可知,cx1d更适合作为y关于x的经验回归方程(2)令t,则ctd,所以c5,所以dc10535,所以cx1d5,故y关于x的非线性经验回归方程为5.(3)一天的利润为W(x0.25)(x0.25)6.2556.25526.25520.51.25,当且仅当x,即x0.5时等号成立,所以预计每吨定价为0.5万元时,该产品一天的销售利润最大,最大利润是1.25万元方法技巧求经验回归方程的步骤针对训练1(2022全国乙卷)某地经过多年的环境治理,已将荒山改造成了绿水青山为估计一林区某种树木的总材积量,随机选取了10颗这种树木,测量每棵树的根部横截面积(单位:m
41、2)和材积量(单位:m3),得到如下数据:样本号i12345678910总和根部横截面积xi0.040.060.040.080.080.050.050.070.070.060.6材积量yi0.250.400.220.540.510.340.360.460.420.403.9(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为186 m2.已知树木的材积量与其根部横截面积近似成正比利用以上数据给出该林区这种树木的总材积量
42、的估计值(2) (xi)(yi)iyi100.013 4,(xi)210()20.002,(yi)210()20.094 8,所以0.011.3770.013 77,所以样本相关系数r0.97.(3)设该林区这种树木的总材积量的估计值为Y m3,由题意可知,该种树木的材积量与其根部横截面积近似成正比,所以,所以Y1 209,即该林区这种树木的总材积量的估计值为1 209 m3.2现代物流成为继劳动力、自然资源外影响企业生产成本及利润的重要因素某企业去年前八个月的物流成本和企业利润的数据(单位:万元)如下表所示:月份12345678物流成本x8383.58086.58984.57986.5利润y
43、114116106122132114m132残差iyii0.20.61.8314.61根据最小二乘法公式求得经验回归方程为3.2x151.8.(1)求m的值,并利用已知的经验回归方程求出8月份对应的残差值8;(2)请先求出线性回归模型3.2x151.8的决定系数R2(精确到0.000 1);若根据非线性模型y267.76ln x1 069.2求得解释变量(物流成本)对于响应变量(利润)决定系数R0.905 7,请说明以上两种模型哪种模型拟合效果更好?(3)通过残差分析,怀疑残差绝对值最大的那组数据有误,经再次核实后发现其真正利润应该为116万元请重新根据最小二乘法的思想与公式,求出新的经验回归方