《2020版导与练一轮复习理科数学课件:第九篇 统计与统计案例(必修3、选修1-2) 第3节 变量的相关性与统计案例 .ppt》由会员分享,可在线阅读,更多相关《2020版导与练一轮复习理科数学课件:第九篇 统计与统计案例(必修3、选修1-2) 第3节 变量的相关性与统计案例 .ppt(52页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第3节变量的相关性与统计案例,考纲展示,知识链条完善,考点专项突破,知识链条完善把散落的知识连起来,知识梳理,1.变量间的相关关系(1)常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系.与函数关系不同,相关关系是一种非确定性关系.(2)从散点图上看,点分布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关,点分布在左上角到右下角的区域内,两个变量的这种相关关系为负相关.,2.回归方程与回归分析(1)线性相关关系与回归直线如果散点图中点的分布从整体上看大致在附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.(2)回归方程最小二乘法:使得样本数据的点到回归直线
2、的最小的方法叫做最小二乘法.,一条直线,距离的平方和,(3)回归分析定义:对具有的两个变量进行统计分析的一种常用方法.,相关关系,相关,当r3.841,所以在犯错误的概率不超过5%的前提下,认为“是否爱吃零食与性别有关”.故选A.,A,4.(2018泉州质检)某厂在生产甲产品的过程中,产量x(吨)与生产能耗y(吨)的对应数据如下表:,答案:59,5.(2018阜阳质检)某班主任对全班30名男生进行了作业量多少的调查,数据如下表:,该班主任据此推断男生认为作业多与喜欢玩电脑游戏有关系,则这种推断犯错误的概率不超过.,答案:0.05,考点专项突破在讲练中理解知识,考点一变量的相关性,【例1】(1)
3、与变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);与变量U与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).r1表示变量Y与X之间的线性相关系数,r2表示变量V与U之间的线性相关系数,则()(A)r2r10(B)0r2r1(C)r200;对于变量V与U而言,V随U的增大而减小,故V与U成负相关,即r20,所以有r200时,正相关;r0时,负相关.,反思归纳,【跟踪训练1】(1)某公司在2018年上半年的收入x(单位:万元)与月支出y(单位:万元)的统计资料如下表所示:,根据统计资
4、料,则()(A)月收入的中位数是15,x与y有正线性相关关系(B)月收入的中位数是17,x与y有负线性相关关系(C)月收入的中位数是16,x与y有正线性相关关系(D)月收入的中位数是16,x与y有负线性相关关系,答案:(1)C,答案:(2),考点二回归分析,反思归纳,(3)在分析两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程来估计和预测.,【跟踪训练2】(2018全国卷)如图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图.,(2)你认为用哪个模型得到的预测值更可靠?并说明理由.,(ii)从计算
5、结果看,相对于2016年的环境基础设施投资额220亿元,由模型得到的预测值226.1亿元的增幅明显偏低,而利用模型得到的预测值的增幅比较合理,说明利用模型得到的预测值更可靠.,考点三独立性检验,【例3】(2018全国卷)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人.第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图,(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;,解:(1)第二种生产方式的效率更高.理由如下(
6、写出一种,合理即可):由茎叶图可知,用第一种生产方式的工人中,有75%的工人完成生产任务所需时间至少80分钟,用第二种生产方式的工人中,有75%的工人完成生产任务所需时间至多79分钟.因此第二种生产方式的效率更高.,由茎叶图可知,用第一种生产方式的工人完成生产任务所需时间的中位数为85.5分钟,用第二种生产方式的工人完成生产任务所需时间的中位数为73.5分钟.因此第二种生产方式的效率更高.由茎叶图可知,用第一种生产方式的工人完成生产任务平均所需时间高于80分钟;用第二种生产方式的工人完成生产任务平均所需时间低于80分钟,因此第二种生产方式的效率更高.由茎叶图可知:用第一种生产方式的工人完成生产
7、任务所需时间分布在茎8上的最多,关于茎8大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多,关于茎7大致呈对称分布,又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少.因此第二种生产方式的效率更高.,(2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m的工人数填入下面的列联表:,(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?,反思归纳,独立性检验的一般步骤(1)根据样本数据制成22列联表,假设两个变量无
8、关系;,(3)比较k与临界值的大小关系作统计推断.,【跟踪训练3】(2018梅州二模)某学校共有1500名学生,为调查该校学生每周使用手机上网时间的情况,采用分层抽样的方法,收集100名学生每周上网时间的样本数据(单位:小时).根据这100个样本数据,得到学生每周上网时间的频率分布直方图(如图所示).其中样本数据的分组区间为0,2,(2,4,(4,6,(6,8,(8,10,(10,12.,(1)估计该校学生每周平均使用手机上网时间(每组数据以组中值为代表);(2)估计该校学生每周使用手机上网时间超过4个小时的概率;,(2)由频率分布直方图得1-2(0.100+0.025)=0.75,估计该校学
9、生每周使用手机上网时间超过4个小时的频率为0.75.,(3)将每周使用手机上网时间在(4,12内的定义为“长时间使用手机上网”;每周使用手机上网时间在(0,4内的定义为“不长时间使用手机上网”.在样本数据中,有25名学生不近视.请完成每周使用手机上网的时间与近视程度的22列联表,并判断是否有95%的把握认为“该校学生的每周使用手机上网时间与近视程度有关”.,解:(3)根据题意填写22列联表如下.,备选例题,【例1】(2018江西模拟)由中央电视台综合频道(CCTV-1)和唯众传媒联合制作的开讲啦是中国首档青年电视公开课,每期节目由一位知名人士讲述自己的故事,分享他们对于生活和生命的感悟,给予中
10、国青年现实的讨论和心灵的滋养,讨论青年们的人生问题,同时也在讨论青春中国的社会问题,受到青年观众的喜爱,为了了解观众对节目的喜爱程度,电视台随机调查了A,B两个地区共100名观众,得到如下的22列联表,已知在被调查的100名观众中随机抽取1名,该观众是B地区中“非常满意”的观众的概率为0.35,且4y=3z.(1)现从100名观众中用分层抽样的方法抽取20名进行问卷调查,则应抽取“满意”的A,B地区的人数各是多少?,(2)在(1)抽取的“满意”的观众中,随机选出2人进行座谈,求至少有1名是B地区观众的概率?,(3)完成上述表格,并根据表格判断是否有95%的把握认为观众的满意程度与所在地区有关系?,【例2】(2018内江三模)有一个同学家开了一个奶茶店,他为了研究气温对热奶茶销售杯数的影响,从一季度中随机选取5天,统计出气温与热奶茶销售杯数,如表:,点击进入应用能力提升,