《2022年高中数学人教A版选修-.《回归分析的基本思想及其初步应用》时word教案 .pdf》由会员分享,可在线阅读,更多相关《2022年高中数学人教A版选修-.《回归分析的基本思想及其初步应用》时word教案 .pdf(9页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、3.1 回归分析的基本思想及其初步应用2【学情分析】 :教学对象是高二理科学生,学生已掌握建立线性回归模型的知识,并能用所学知识解决一些简单的实际问题。在教学中,要结合实例,让学生了解随机误差产生的原因。初步了解可以通过求回归模型的相关指数或利用残差分析不同的回归模型的拟合精确度。在起点高的班级中通过让学生观察、思考与讨论, 进一步体会回归分析中的数理计算,及运用相关指数与残差分析来刻画模型拟合效果,初步形成运用统计方法解决实际问题的基本思想,认识统计方法在决策中的作用。【教学目标】 : 1知 识 与 技 能 :了解求线形回归方程的两个计算公式的推导过程,、回归平方和;了解随机误差产生的原因;
2、了解判断刻画模型拟合效果的方法相关指数和残差分析;了解非线性模型通过变换转化为线性回归模型。 2 过 程 与 方 法 : 本节内容先从大学中女大学生的甚高和体重之间的关系入手,求出相应的回归直线方程,从中也找出存在的不足,从而有进行回归分析的必要性,进而学习相关指数,用相关指数来刻画回归的效果。 3情 感 态 度 与 价 值 观 :从实际问题中发现自己已有知识的不足之处,激发学生的好奇心和求知欲,培养学生不满足于已有知识,勇于求知的良好个性品质,引导学生积极进取。【教学重点】 :1.了解判断刻画模型拟合效果的方法相关指数和残差分析;2.通过探究使学生体会有些非线性模型通过变换可以转化为线性回归
3、模型。【教学难点】 :1.了解随机误差产生的原因,用残差平方和衡量回归方程的预报精度;2.了解判断刻画模型拟合效果的方法相关指数和残差分析。【教学过程设计】 :教学环节教学活动设计意图一、创设情境1由例 1 知,体重的值受身高或随机误差的影响。2问题一:身高172cm的女大学生的体重一定是吗?如果不是,其原因是什么?引入回归分析的效果评价的三个统计量二、探究新知解答问题一:显然, 身高 172cm的女大学生的体重不一定是,但一般可以认为她的结合实例由结果分析残差图是否异常,养成从实际问题出发,抽象为数学问题中的线性回归问题,从而指导 实 际 问 题 的 解决。40455055606570150
4、155160165170175180名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 1 页,共 9 页 - - - - - - - - - 体重接近于 .上图 3.1-2 中的样本点和回归直线的相互位置说明了这一点. 由于所有的样本点不共线,而只是散布在某一条直线的附近,所以身高和体重的关系可用下面的线性回归模型来表示: y=bx+a+e (3) 这里 a 和 b 为模型的未知参数,e 是 y 与abxy之间的误差。通常e为随机变量 ,称为 随机误差 ,它的均值E(e)=0, 方差
5、D(e)=02. 这样线性回归模型的完整表达式为:2)(, 0)(eDeEeabxy (4) 在线性回归模型4中,随机误差e 的方差2越小,通过回归直线abxy5预报真实值y 的精度越高。 随机误差是引起预报值y与真实值y 之间的误差的原因之一,大小取决于随机误差的方差。另一方面,由于公式1和 2中ba和为截距和斜率的估计值,它们与真实值a 和 b 之间也存在误差, 这种误差是引起预报值y与真实值y 之间误差的另一个原因。思考 1、产生随机误差项e 的原因是什么?答:实际上,从上例中,一个人的体重值除了受身高的影响外,还受到许多其它因素的影响。例如饮食习惯、是否喜欢运动、度量误差等。另外,我们
6、选用的线性模型往往只是一种近似的模型。所有这些因素都会导致随机误差项e 的产生。问题二、在线性回归模型中,e 是用y预报真实值y 的误差,它是一个不可观测的量,那么应该怎样研究随机误差?如何衡量预报的精度?解答问题二:因为随机误差是随机变量,因此可以通过这个随机变量的数字特征来刻画它的一些总体特征。均值是反映随机变量取值平均水平的数字特征,方差是反映随机变量集中于均值程度的数字特征,而随机误差的均值为0,因此可以用方差2来衡量随机误差的大小。为了衡量预报的精度,需要估计2的值。一个自然的想法是通过样本方差来估计总体方差。如何得到随机变量e 的样本呢?由于模型(3) 或(4) 中的 e 隐含在预
7、报变量y 中,我们无法精确地把它从y 中别离出来,学生思考,答复名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 2 页,共 9 页 - - - - - - - - - 因此也就无法得到随机变量e 的样本。解决问题的途径是通过样本的估计值来估计2。根据截距和斜率的估计公式 1和 2 ,可以建立回归方程axby因此y是5中y的估计量。由于随机误差yye, 所以yye是e 的估计量,对于样本点),(),(2211yxyx),(,nnyx而言,相当于它们的随机误差为abxyyyeiiiii,
8、i=1,2, ,n, 其估计值为axbyyyeiiii,i=1,2, ,n, ie称为相应于点),(iiyx的残差residual 。类比样本方差估计总体方差的思想,可以用),(2121212baQnenini (n2) 作为2的估计量,其中ba和由公式 1 2给出,),(baQ称为残差平方和 residual sum of squares, 可以用2衡量回归方程的预报精度。通常,2越小,预报精度越高。学生动手计算出例1 中的残差如下表与残差平方和。编号1 2 3 4 5 6 7 8身高 /cm 165 165 157 170 175 165 155 17体重 /kg 48 57 50 54
9、64 61 43 59yiei361.128?12niiiyy学习要领:注意iy、iy ?、y的区别;当残差平方和越小,此时模型的拟合效果越好; 对 于 多 个 不 同 的 模 型 , 我 们 还 可 以 引 入 相 关 指 数引导学生利用残差也可以分析所求出的模型的拟合效果名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 3 页,共 9 页 - - - - - - - - - niiniiiyyyyR12122?1来刻画回归的效果,它表示解释变量对预报变量变化的奉献率. 2R的值越接
10、近于1, 说明残差平方和越小, 也就是说模型拟合的效果越好,即解释变量和预报变量的线性相关性越强. 代入例 1 中的数据知例1 中的64.0?112122niiniiiyyyyR,说明“女大学生的身高解释了64的体重变化” ,或者说“女大学生的体重差异有 64是由身高引起的” 。即解释变量对总效应约奉献了64% ,而随机误差奉献了剩余的36% , 所以身高对体重的效应比随机误差的效应大得多。用身高预报体重时,需要注意以下问题:1 回归方程只适用于我们研究的样本的总体。2 我们所建立的回归方程一般都有时间性。3 样本取值的范围会影响回归方程的适用范围。4 不能期望回归方程得到的预报值就是预报变量
11、的精确值。一般地,建立回归模型的基本步骤为:(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量;(2)画出确定好的解释变量和预报变量的散点图,观察它们之间的关系如是否存在线性关系等;(3)由经验确定回归方程的类型如我们观察到数据呈线性关系,则选用线性回归方程y=bx+a; (4)按一定规则估计回归方程中的参数如最小二乘法;(5)得出结果后分析残差图是否有异常个别数据对应残差过大,或残差呈现不随机的规律性等等,假设存在异常,则检查数据是否有误,或模型是否合适等。问题三:观察图31-3 中的残差图,样本点是如何分布?有无异常情况个别数据对应残差过大,或残差呈现不随机的规律性等等?师:提
12、出问题,指导学生画出残差图以残差为纵坐标,样本编号或身高或体重为横坐标作出图形,引导学生进行残差分析,从而做到检查数据是否有误,或模型是否合适等。通过学生动手计算感受相关指数2R与残差分析说明回归 方 程 的 预 报 情况。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 4 页,共 9 页 - - - - - - - - - 残差图-8-6-4-2024680123456789编号残差ei生:分析、讨论。从残差图中可以看到第1 个样本点和第6 个样本点的残差较大,需要确认是否出现采集
13、的错误,指导学生去掉这两个数据后重新再计算回归方程与相关指数2R,了解到拟合的效果会更好。引导学生归纳残差所能说明的情况: 样本点的残差比较大,确认采集数据时是否出现人为的错误或其他原因; 残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,带状区域的宽度越窄,模型拟合精度越高,回归方程的预报精度越高。三、例题选讲例 2:一只红铃虫的产卵数y和温度x有关,现收集了7 组观测数据列于下表中,试建立y与x之间的回归方程。编号1 2 3 4 5 6 7 温度x/ C21 23 25 27 29 32 35 产卵数y/ 个7 11 21 24 66 115 325 问题四:例2 中如何选择解
14、释变量与预报变量?师:读例 2 的要求,引导学生理解例题含义。生:思考、讨论、表达自己的理解。形成把温度x作自变量,红铃虫的产卵数y作因变量的共识问题四:观察图31-4 中的散点图,红铃虫的产卵数y与温度x具有线性关系吗?除线性关系外,还学过哪些常见的函数关系?师:绘制散点图31-4 ,引导学生观察散点图的特点:随着自变量的增加,因变量也随之增加。引导学生探究红铃虫的产卵数y与温度x更可能是什么关系,选择几个模型,比方线性回归模型、二次函数模型、指数函数模型。而二次与指数函数模型是属于非线性回归模型。引导学生分析哪 个 变 量 作 自 变量,哪个变量作因变量引导学生根据散点图判断两个变量的关系
15、,使学生了解不是任何两个变量都 一 定 是 线 性 关系。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 5 页,共 9 页 - - - - - - - - - 产卵数与温度的关系050100150200250300350202224262830323436温度产卵数 y/ 个生:讨论、回忆一些常见函数图象的特点,判断红铃虫的产卵数y与温度x的可能关系从散点图中可以看到样本点分布在指数函数曲线xcecy21的周围。问题五:请学生思考能否把模型xcecy21经过变换后转化为另外两个变量
16、的线性关系?师:提出问题,引导学生寻找变换的方法,在学生讨论后给出具体的方法。生:思考、讨论、解释。解答过程如下:对xcecy21两边取自然对数xeccexccececyxcxclnlnlnlnlnlnlnln21211122令yzln,建立z与x之间的线性回归方程xccz21ln问题 六 : 经 过 变换 后 指 数 函数 模 型xcecy21转化 为 线 性 回归 模 型xccz21ln,你如何得到这个线性回归模型的参数估计?师:提出问题,引导学生分组讨论,启发学生把原变量的观测数据转化为新变量的数据,然后让学生给出每种线性回归模型的参数估计。生:以组为单位进行数据变换,求参数的最小二乘估
17、计可以用计算器解答过程如下:令1ln ca,2cb,即bxaz分析x与z之间的关系,通过画散点图如以下图,可知x与z之间 是 存 在着 线 性 回 归 关 系 , 可 以 用 最 小二 乘 法 求 出 线 性 回 归 方 程使学生进一步体会把因变量与自变量的非线性关系经过变换后转化为另外两个变量的线性关系的方法。使学生熟悉线性回归模型的参数估计的方法名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 6 页,共 9 页 - - - - - - - - - bxaz列表计算出各个量编号1
18、2 3 4 5 6 7 合计温度x/ C21 23 25 27 29 32 35 192 产卵数y/个7 11 21 24 66 115 325 569 z=ln y 1.946 2.398 3.045 3.178 4.190 4.745 5.784 25.285 xi2441 529 625 729 841 1024 1225 5414 xizi40.9 55.2 76.1 85.8 121.5 151.8 202.4 733.7 xzniix125414 niyiyx1272.043.277541461.343.2777.733?22121xnxzxnzxbniiniii843.3?xbz
19、a843.3272.0?xz问题七: 我们的目标是建立红铃虫的产卵数y与温度x的模型, 如何使得到的线性回归模型再变回红铃虫的产卵数y与温度x的模型?师:提出问题。生:进行变换,每组得到红铃虫的产卵数y与温度x的模型。因为yzln,所以843.3272.0?lnxy,即843. 3272. 0?xey。得出红铃虫的产卵数y与温度x的模型四、练习1 试对以下非线性模型进行适当的变形,使之线性化稳固知识名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 7 页,共 9 页 - - - - -
20、 - - - - axey;bxay解:对axey两边取自然对数,即eaxyeyaxlnlnlnln令yzln,则有axz令xt1,则有baty五、小结1 初步了解用残差平方和如何评价模型拟合效果的好坏;2 注意回归方程适用的范围、时间。3 归纳非线性回归模型的求解步骤:画出两个变量的散点图;判断是否线性相关;非线性相关模型要进行变换,转为线性回归模型;求出回归模型的方程利用最小二乘法。反思归纳练习与测试1 下面 4 个散点图中,不适合用线性回归模型拟合其中两个变量的是 A A BC D2 将非线性模型xey32进行适当变形使之线性化。答案:2ln32lnln3lnxzexy3 已知回归方程3
21、5.0log21.1?2xy, 则样本点P4, 2 71 的残差为 _。答案:56.015.271.235.04log2.171.2?2yye4 已知线性相关的两变量x,y的三个样本点A0,0 ,B1,3 ,C4,11 ,假设用直线AB作为其预测模型,则点C的残差是 _。答案:xyAB3?,12?Cy,1?Ce。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 8 页,共 9 页 - - - - - - - - - 5 假设一组观测值 x1,y1 、 x2,y2 、 xn,yn之间满足
22、yi=bxi+a+ei (i=1、2. n)假设ei恒为 0,则R2为答案: 1 6 已知线性相关的两变量x,y的三个样本点A0,0 ,B1,3 ,C4,11 ,假设用直线AB作为其预测模型,则其相关指数2R_。答案:xyAB3?,7y,0?1y,3?2y,12?3y7?1yy,4?2yy,5?3yy0?1e,0?2e,1?3e989.090112R7 现有一个由身高预测体重的回归方程:体重预测值4磅 /英寸身高130磅。其中体重和身高分别以磅和英寸为单位,已知1 英寸 25 cm,1 磅 045 kg,则该回归方程应该是_。答案:体重预测值072kg/ cm身高 585kg名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 9 页,共 9 页 - - - - - - - - -