《一元线性回归模型 学案-高二下学期数学人教A版(2019)选择性必修第三册.docx》由会员分享,可在线阅读,更多相关《一元线性回归模型 学案-高二下学期数学人教A版(2019)选择性必修第三册.docx(11页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、21届学案 选择性必修第三册A学案 一元线性回归模型重点1. 了解回归模型与函数模型的区别; 2. 尝试做散点图,求回归直线方程。难点1. 求回归直线方程,会用所学知识对实际问题进行回归分析;2. 掌握回归分析的实际价值与基本思想。考试要求考试 题型 选择题、填空题 难度 简单题核心知识点一:变量间的相关关系1. 变量间的相关关系(1)常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系不同,相关关系是一种非确定性关系。(2)从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关,点散布在左上角到右下角的区域内,两个变量的相关关系为负相关。核心知
2、识点一:两个变量的线性相关关系1. 回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做回归直线。求出的回归直线方程简称回归方程。2. 回归直线方程的求法设与个观测点()最接近的直线方程为,其中,是待定系数。则 ,其中,。相应的直线叫做回归直线,对两个变量所进行的上述统计分析叫做回归分析。 3. 回归直线几条结论:(1)回归直线过样本的中心点。(2)b0时,y与x正相关,散点图呈上升趋势;b0时,y与x负相关,散点图呈下降趋势。(3)相关系数: 当r0时,表明两个变量正相关;当r0时,表明两个变量负相关。r的绝对值越接近于1,表明两个
3、变量的线性相关性越强;r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系。通常|r|大于0. 75时,认为两个变量有很强的线性相关性。特别地:(1)只有在散点图大致呈线性时,求出的回归直线方程才有实标意义。否则,求出的回归直线方程毫无意义;(2)回归直线经过样本中心点。类型一:相关关系的判断例题1 (1)下列四个散点图中,变量x与y之间具有负的线性相关关系的是()(2)对四组数据进行统计,获得如图所示的散点图,关于其相关系数的比较,正确的是()A. r2r40r3r1 B. r4r20r1r3C. r4r20r3r1 D. r2r40r1r3【思路分析】(1)由散点图中点的分布从整体
4、上看大致在一条直线附近,这两个变量之间具有线性相关关系;(2)根据 r的绝对值越接近于1,表明两个变量的线性相关性越强进行判定。【解析】(1)观察散点图可知,只有D选项的散点图表示的是变量x与y之间具有负的线性相关关系。故选D。(2)由相关系数的定义以及散点图所表达的含义可知r2r40r3r1。故选A。【总结提升】判断相关关系的两种方法(1)散点图法:如果所有的样本点都落在某一函数的曲线附近,变量之间就有相关关系。如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系。(2)相关系数法:利用相关系数判定,当|r|越趋近于1相关性越强。类型二:求线性回归方程例题2 某校为了了解在校学生的支
5、出情况,组织学生调查了该校2014年至2020年学生的人均月支出(单位:百元)的数据如下表:年份2014201520162017201820192020年份代号1234567人均月支出2. 93. 33. 64. 44. 85. 25. 9(1)求关于的线性回归方程;(2)利用(1)中的回归方程,分析2014年至2020年该校学生人均月支出的变化情况,并预测该校2025年的人均月支出。附:回归直线的斜率和截距的最小二乘估计公式分别为:,。【思路分析】利用公式,求出回归系数,写出回归直线方程,用回归直线方程进行估计和预测。【解析】(1)由所给数据计算得,。所求回归方程为。(2)由(1)知,故20
6、14年至2020年该校学生人均月支出逐年增加,平均每年增加0. 5百元。将2025年的年份代号代入(1)中的回归方程,得y=0. 512+2. 3=8. 3,故预测该校2025年人均月支出为8. 3百元。【总结提升】1. 回归直线方程中系数的两种求法(1)公式法:利用公式,求出回归系数,;(2)待定系数法:利用回归直线过样本点中心求系数。2. 回归分析的两种策略(1)利用回归方程进行预测:把回归直线方程看作一次函数,求函数值;(2)利用回归直线判断正、负相关:决定正相关还是负相关的是回归系数。类型三:非线性回归问题例题3 在一次抽样调查中测得样本的5个样本点,数值如下表:x0.250.5124
7、y1612521试建立y与x之间的回归方程。【思路分析】并非所有的变量间均为线性相关关系,可借助散点图直观感知,再借助回归分析判断回归模型的拟合的效果。【解析】由数值表可作散点图如图.根据散点图可知y与x具有反比例函数关系,设,令,则ykt,原数据变为:t4210.50.25y1612521由置换后的数值表作散点图如下:由散点图可以看出y与t呈近似的线性相关关系。所以 所以所以.所以y与x的回归方程是.【总结提升】非线性回归问题的处理方法1. 指数函数型y=ebx+a(1)函数y=ebx+a的图象:(2)处理方法:两边取对数得lny=lnebx+a,即lny=bx+a.令z=ln y,把原始数
8、据(x,y)转化为(x,z),再根据线性回归模型的方法求出a,b。2. 对数函数型y=bln x+a(1)函数y=blnx+a的图象:(2)处理方法:设x=ln x,原方程可化为y=bx+a,再根据线性回归模型的方法求出a,b。3. y=bx2+a型处理方法:设x=x2,原方程可化为y=bx+a,再根据线性回归模型的方法求出a,b。常见易错问题剖析某市2015年至2019年新能源汽车年销量(单位:百台)与年份代号的数据如下表:年份20152016201720182019年份代号01234年销量10152035若根据表中的数据用最小二乘法求得关于的回归直线方程为,则表中的值为( )A. 22B.
9、 25. 5C. 28. 5D. 30【错解】C 由关于的回归直线方程为,故当时,故选C。【错因分析】由关于的回归直线方程为算出的是估计值,不是准确值,故此出错。应根据回归直线方程经过样本点中心进行求解。【正解】D 因为,代入回归直线方程,可得,结合表中数据可知,解得。故选D。【总结提升】准确理解回归直线方程作用是进行估计与预测,并理解记忆回归直线方程经过样本点中心。1. 回归分析的基本步骤是进行相关性检验,求回归直线方程并用回归直线方程进行预报。2. 对于一组具有线性相关关系的数据(xi,yi)(i=1,2,n),回归方程为,其中b的估计值,。3. 样本相关系数的具体计算公式为,|r|越接近
10、于1,两个变量的相关程度越强,|r|越接近于0,两个变量的相关程度越弱,当|r|0. 05时,寻找回归直线方程已经毫无意义。(答题时间:40分钟)一、选择题1. 下列语句表示的事件中的因素不具有相关关系的是( )A. 瑞雪兆丰年B. 名师出高徒C. 不积跬步,无以至千里D. 喜鹊叫喜,乌鸦叫丧2. 在对具有线性相关的两个变量和进行统计分析时,得到如下数据:48101212356由表中数据求得关于的回归方程为,则,这三个样本点中落在回归直线下方的有( )个A. 1B. 2C. 3D. 03. 四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归直线方程,分别得到以下四个结论:y与x
11、负相关且=2. 347x6. 423;y与x负相关且=3. 476x+5. 648;y与x正相关且=5. 437x+8. 493;y与x正相关且=4. 326x4. 578。其中一定不正确的结论的序号是()A. B. C. D. *4. 下列说法错误的是( )A. 在线性回归分析中,相关系数r的值越大,变量间的相关性越强B. 自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系C. 在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高D. 在问归分析中,为0. 98的模型比为0. 80的模型拟合的效果好5. 对具有线性相关关系的变量有一组观测数据,其回归直
12、线方程是:,且,则( )A. B. C. D. 二、填空题6. 调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的回归直线方程:=0. 245x+0. 321。由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加_万元。7. 在2020年月日,某市物价部门对本市的家商场的某商品的一天销售量及其价格进行调查,家商场的售价元和销售量件之间的一组数据如下表所示:价格销售量由散点图可知,销售量与价格之间有较好的线性相关关系,其线性回归直线方程是:(参考公式:回归方程,),则_。三、解答题*8. 下
13、表是某厂生产某种产品的过程中记录的几组数据,其中x表示产量(单位:吨),y表示生产中消耗的煤的数量(单位:吨)x23456y22. 53. 54. 56. 5(1)试在给出的坐标系下作出散点图,根据散点图判断,在与中,哪一个方程更适合作为变量y关于x的回归方程模型?(给出判断即可,不需要说明理由)(2)根据(1)的结果以及表中数据,建立变量y关于x的回归方程。并估计生产100吨产品需要准备多少吨煤。参考公式:,答案1.【答案】D【解析】A. 瑞雪对小麦有好处,可能使得小麦丰收,所以瑞雪兆丰年具有相关关系;B. 名师水平高,可能使得学生学习好,所以名师出高徒具有相关关系;C. 不积跬步,就不会有
14、千里,所以不积跬步,无以至千里具有相关关系; D. 喜鹊叫喜,乌鸦叫丧,两者没有必然的关系。故选D。2.【答案】B【解析】因为,所以将其代入可得,故当时,在直线上方;当时,在直线下方;当时,在直线下方,应选答案B。3.【答案】D【解析】由题意得,当回归系数时,与正相关;当回归系数时,与负相关,所以只有是不正确的,故选D。4.【答案】A【解析】A. 在线性回归分析中,相关系数r的绝对值越接近1,变量间的相关性越强,错误;B. 根据相关关系的定义知正确;C. 在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高,正确;D. 在问归分析中,的值越大,模型拟合的效果越好,正确;故选A。5
15、.【答案】D【解析】根据题中条件,由于回归方程过样本中心点:,故选D。6.【答案】0. 245【解析】当变为时,=0. 245(x+1)+0. 321=0. 245x+0. 321+0. 245,而0. 245x+0. 321+0. 245-(0. 245x+0. 321)=0. 245。因此家庭年收入每增加1万元,年饮食支出平均增加0. 245万元,故答案为0. 245。7.【答案】【解析】由数据表可知:;,故答案为40。8.【解析】(1)散点图如图所示更适合作为变量y关于x的回归方程模型。(2)由表格可得,关于的回归方程为。当时,。所以,估计生产100吨产品需要准备吨煤。第11页学科网(北京)股份有限公司