《2020年高考数学一轮复习第九章概率与统计第11讲回归分析与独立性检验课件理.ppt》由会员分享,可在线阅读,更多相关《2020年高考数学一轮复习第九章概率与统计第11讲回归分析与独立性检验课件理.ppt(64页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第11讲回归分析与独立性检验,1.会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系.2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.3.了解下列一些常见的统计方法,并能应用这些方法解决一些实际问题.(1)了解独立性检验(只要求22列联表)的基本思想、方法及其简单应用.(2)了解回归的基本思想、方法及其简单应用.,1.变量间的关系,(1)常见的两变量之间的关系有两类:一类是函数关系,,另一类是相关关系.与函数关系不同,相关关系是一种非确定性关系.,(2)将样本中n个数据点(xi,yi)(i1,2,n)描在平面直角坐标系中,表示两个变量关系的一组数据的
2、图形叫做散点图.,(3)正相关、负相关.,在散点图中,点散布在从左下角到右上角的区域,两个,变量的这种相关关系称为正相关.,在散点图中,点散布在从左上角到右下角的区域,两个,变量的这种相关关系称为负相关.,2.回归分析,(1)定义:对具有相关关系的两个变量进行统计分析的一种,常用方法.,(2)线性相关关系:,观察散点图的特征,如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.,(3)回归直线的求法:,对于一组具有线性相关关系的数据(x1,y1),(x2,y2),,得到回归直线的方法,即求回归直线,使得样本数据的点到它的距离的平方和最
3、小,这一方法叫做最小二乘法,则回归直线,样本点的中心,(4)线性相关强度的检验:,当r0时,表明两个变量正相关;,当r0时,表明两个变量_.,负相关,r的绝对值越接近于1,表明两个变量的线性相关性越强.r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常|r|大于0.75时,认为两个变量有很强的线性相关性.,(5)相关指数:,R2的值越大,说明残差平方和越小,也就是说模型的拟合效果越好.在线性回归模型中,R2表示解释变量对于预报变量变化的贡献率,R2越接近于1,表示回归的效果越好.,3.独立性检验,(1)分类变量:变量的不同“值”表示个体所属的不同类,别,像这类变量称为分类变量.
4、,(2)列联表:列出两个分类变量的频数表,称为列联表.假设有两个分类变量X和Y,它们的可能取值分别为x1,x2和y1,y2,其样本频数列联表(称为22列联表)为,22列联表,n_为样本容量.,(3)独立性检验:利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验.,abcd,1.第31届夏季奥林匹克运动会,中国获26金,18银,26铜共70枚奖牌居奖牌榜第二,并打破3次世界纪录.由此许多人认为中国进入了世界体育强国之列,也有许多人持反对意见.有网友为此进行了调查,在参加调查的2548名男性公民中有1560名持反对意见,2452名女性公民中有1200人持反对意见,在运用这些数据说明中
5、国的奖牌数与中国进入体育强国有无关,),系时,用什么方法最有说服力(A.平均数与方差C.独立性检验,B.回归直线方程D.概率,解析:由于参加讨论的公民按性别被分成了两组,而且每一组又被分成了两种情况:认为有关与无关,故该资料取自完全随机统计,符合22列联表的要求.故用独立性检验最有说服力.,答案:C,解析:因为变量x和y正相关,则回归直线的斜率为正,,故可以排除选项C和D.,因为样本点的中心在回归直线上,把点(3,3.5)分别代入选项A和B中的直线方程进行检验,可以排除B.故选A.,答案:A,3.对四组数据进行统计,获得以下关于其相关系数的比较,,正确的是(,),A,图9-6-1,A.r2r4
6、0r3r1B.r4r20r1r3C.r4r20r3r1D.r2r40r1k0)的k0作为拒绝域的临界值.,【互动探究】4.某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量之间的关系,随机抽查52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是(),表1,成绩,表2表3智商,视力,表4,A.成绩C.智商,阅读量B.视力D.阅读量,答案:D,易错、易混、易漏,对回归分析的理解,例题:基于移动互联技术的共享单车被称为“新四大发明”之一,短时间内就风靡全国,带给人们新的出行体验.某共享单车运营公司的市场研究人员为了解公司的经营状况,对该公司最近六个月内的市场占有率进行了统
7、计,结果如下表:,(1)请在给出的坐标纸中作出散点图,并用相关系数说明可用线性回归模型拟合月度市场占有率y与月份代码x之间的关系;,图9114,(2)求y关于x的线性回归方程,并预测该公司2018年2月份的市场占有率;(3)根据调研数据,公司决定再采购一批单车扩大市场,现有采购成本分别为1000元/辆和800元/辆的A,B两款车型报废年限各不相同.考虑到公司的经济效益,该公司决定先对两款单车各100辆进行科学模拟测试,得到两款单车使用寿命频数表如下:,经测算,平均每辆单车每年可以为公司带来收入500元.不考虑除采购成本之外的其他成本,假设每辆单车的使用寿命都是整数年,且用频率估计每辆单车使用寿
8、命的概率,以每辆单车产生利润的期望值为决策依据.如果你是该公司的负责人,你会选择采购哪款车型?,解:,图9115,(1)散点图如图9115所示:,(3)用频率估计概率,A款单车的利润X的分布列为:E(X)5000.100.35000.410000.2350(元).B款单车的利润Y的分布列为:E(Y)3000.152000.47000.3512000.1400(元).以每辆单车产生利润的期望值为决策依据,故应选择B款车型.,【方法点拨】判断两个变量是否线性相关及相关程度通常有两种方法:利用散点图直观判断;将相关数据代入相关系数r公式求出r,然后根据r的大小进行判断.求线性回归方程时在严格按照公式求解时,一定要注意计算的准确性.,【互动探究】,图9-11-6,答案:D,