《2023年回归分析的基本思想及其初步应用精品讲义.pdf》由会员分享,可在线阅读,更多相关《2023年回归分析的基本思想及其初步应用精品讲义.pdf(4页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第一课时 1.1 回归分析的基本思想及其初步应用(一)教学要求:通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用.教学重点:了解线性回归模型与函数模型的差异,了解判断刻画模型拟合效果的方法相关指数和残差分析.教学难点:解释残差变量的含义,了解偏差平方和分解的思想.教学过程:一、复习准备:1.提问:“名师出高徒”这句彦语的意思是什么?有名气的老师就一定能教出厉害的学生吗?这两者之间是否有关?2.复习:函数关系是一种确定性关系,而相关关系是一种非确定性关系.回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法,其步骤:收集数据作散点图求回归直线方程利用方程进行预报.二、讲授
2、新课:1.教学例题:例 1 从某大学中随机选取 8 名女大学生,其身高和体重数据如下表所示:编 号 1 2 3 4 5 6 7 8 身高/cm 165 165 157 170 175 165 155 170 体重/kg 48 57 50 54 64 61 43 59 求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为 172cm 的女大学生的体重.(分析思路教师演示学生整理)第一步:作散点图 第二步:求回归方程 第三步:代值计算 提问:身高为 172cm 的女大学生的体重一定是 60.316kg 吗?不一定,但一般可以认为她的体重在 60.316kg 左右.解释线性回归模型与一次
3、函数的不同 事实上,观察上述散点图,我们可以发现女大学生的体重y和身高x之间的关系并不能用一次函数ybxa来严格刻画(因为所有的样本点不共线,所以线性模型只能近似地刻画身高和体重的关系).在数据表中身高为 165cm 的 3 名女大学生的体重分别为 48kg、57kg 和 61kg,如果能用一次函数来描述体重与身高的关系,那么身高为 165cm 的 3 名女在学生的体重应相同.这就说明体重不仅受身高的影响还受其他因素的影响,把这种影响的结果e(即残差变量或随机变量)引入到线性函数模型中,得到线性回归模型ybxae,其中残差变量e中包含体重不能由身高的线性函数解释的所有部分.当残差变量恒等于 0
4、 时,线性回归模型就变成一次函数模型.因此,一次函数模型是线性回归模型的特殊形式,线性回归模型是一次函数模型的一般形式.2.相关系数:相关系数的绝对值越接近于 1,两个变量的线性相关关系越强,它们的散点图越接近一条直线,这时用线性回归模型拟合这组数据就越好,此时建立的线性回归模型是有意义.3.小结:求线性回归方程的步骤、线性回归模型与一次函数的不同.第二课时 1.1 回归分析的基本思想及其初步应用(二)010203040506070150155160165170175180身高/cm体重/kg教学要求:通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用.教学重点:了解评价回归效果
5、的三个统计量:总偏差平方和、残差平方和、回归平方和.教学难点:了解评价回归效果的三个统计量:总偏差平方和、残差平方和、回归平方和.教学过程:一、复习准备:1由例 1 知,预报变量(体重)的值受解释变量(身高)或随机误差的影响.2为了刻画预报变量(体重)的变化在多大程度上与解释变量(身高)有关?在多大程度上与随机误差有关?我们引入了评价回归效果的三个统计量:总偏差平方和、残差平方和、回归平方和.二、讲授新课:1.教学总偏差平方和、残差平方和、回归平方和:(1)总偏差平方和:所有单个样本值与样本均值差的平方和,即21()niiSSTyy.残差平方和:回归值与样本值差的平方和,即21()niiiSS
6、Eyy.回归平方和:相应回归值与样本均值差的平方和,即21()niiSSRyy.(2)学习要领:注意iy、iy、y的区别;预报变量的变化程度可以分解为由解释变量引起的变化程度与残差变量的变化程度之和,即222111()()()nnniiiiiiiyyyyyy;当总偏差平方和相对固定时,残差平方和越小,则回归平方和越大,此时模型的拟合效果越好;对于多个不同的模型,我们还可以引入相关指数22121()1()niiiniiyyRyy 来刻画回归的效果,它表示解释变量对预报变量变化的贡献率.2R的值越大,说明残差平方和越小,也就是说模型拟合的效果越好.2.教学例题:例 2 关于x与Y有如下数据:x 2
7、 4 5 6 8 y 30 40 60 50 70 为了对x、Y两个变量进行统计分析,现有以下两种线性模型:6.517.5yx,717yx,试比较哪一个模型拟合的效果更好.分析:既可分别求出两种模型下的总偏差平方和、残差平方和、回归平方和,也可分别求出两种模型下的相关指数,然后再进行比较,从而得出结论.(答案:52211521()155110.8451000()iiiiiyyRyy ,221R 521521()18010.821000()iiiiiyyyy,84.5%82%,所以甲选用的模型拟合效果较好.)3.小结:分清总偏差平方和、残差平方和、回归平方和,初步了解如何评价两个不同模型拟合效果
8、的好坏.第三课时 1.1 回归分析的基本思想及其初步应用(三)教学要求:通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用.学难点解释残差变量的含义了解偏差平方和分解的思想教学过程一复习确定性关系回归分析是对具有相关关系的两个变量进行统计分析的一种身高体重求根据一名女大学生的身高预报她的体重的回归方程并预报一教学重点:通过探究使学生体会有些非线性模型通过变换可以转化为线性回归模型,了解在解决实际问题的过程中寻找更好的模型的方法.教学难点:了解常用函数的图象特点,选择不同的模型建模,并通过比较相关指数对不同的模型进行比较.教学过程:一、复习准备:1.给出例 3:一只红铃虫的产卵数y
9、和温度x有关,现收集了 7 组观测数据列于下表中,试建立y与x之间的回归方程.温度/xC 21 23 25 27 29 32 35 产卵数/y个 7 11 21 24 66 115 325(学生描述步骤,教师演示)2.讨论:观察右图中的散点图,发现样本点并没有分布在某个带状区域内,即两个变量不呈线性相关关系,所以不能直接用线性回归方程来建立两个变量之间的关系.二、讲授新课:1.探究非线性回归方程的确定:如果散点图中的点分布在一个直线状带形区域,可以选线性回归模型来建模;如果散点图中的点分布在一个曲线状带形区域,就需选择非线性回归模型来建模.根据已有的函数知识,可以发现样本点分布在某一条指数函数
10、曲线y=2C1exC的周围(其中12,c c是待定的参数),故可用指数函数模型来拟合这两个变量.在上式两边取对数,得21lnlnyc xc,再令lnzy,则21lnzc xc,而z与x间的关系如下:X 21 23 25 27 29 32 35 z 1.946 2.398 3.045 3.178 4.190 4.745 5.784 观察z与x的散点图,可以发现变换后样本点分布在一条直线的附近,因此可以用线性回归方程来拟合.利用计算器算得3.843,0.272ab,z与x间的线性回归方程为0.2723.843zx,因此红铃虫的产卵数对温度的非线性回归方程为0.2723.843xye.利用回归方程探
11、究非线性回归问题,可按“作散点图建模确定方程”这三个步骤进行.其关键在于如何通过适当的变换,将非线性回归问题转化成线性回归问题.2.小结:用回归方程探究非线性回归问题的方法、步骤.三、巩固练习:为了研究某种细菌随时间 x 变化,繁殖的个数,收集数据如下:天数 x/天 1 2 3 4 5 6 繁殖个数 y/个 6 12 25 49 95 190(1)用天数作解释变量,繁殖个数作预报变量,作出这些数据的散点图;(2)试求出预报变量对解释变量的回归方程.(答案:所求非线性回归方程为0.691.112y=ex.)第四课时 1.1 回归分析的基本思想及其初步应用(四)教学要求:通过典型案例的探究,进一步
12、了解回归分析的基本思想、方法及初步应用.教学重点:通过探究使学生体会有些非线性模型通过变换可以转化为线性回归模型,了解在解050100150200250300350010203040温度产卵数01234567010203040 xz学难点解释残差变量的含义了解偏差平方和分解的思想教学过程一复习确定性关系回归分析是对具有相关关系的两个变量进行统计分析的一种身高体重求根据一名女大学生的身高预报她的体重的回归方程并预报一决实际问题的过程中寻找更好的模型的方法,了解可用残差分析的方法,比较两种模型的拟合效果.教学难点:了解常用函数的图象特点,选择不同的模型建模,并通过比较相关指数对不同的模型进行比较.
13、教学过程:一、复习准备:1.提问:在例 3 中,观察散点图,我们选择用指数函数模型来拟合红铃虫的产卵数y和温度x间的关系,还可用其它函数模型来拟合吗?2.讨论:能用二次函数模型234yc xc来拟合上述两个变量间的关系吗?(令2tx,则34yc tc,此时y与t间的关系如下:观察y与t的散点图,可以发现样本点并不分布在一条直线的周围,因此不宜用线性回归方程来拟合它,即不宜用二次曲线234yc xc来拟合y与x之间的关系.)小结:也就是说,我们可以通过观察变换后的散点图来判断能否用此种模型来拟合.事实上,除了观察散点图以外,我们也可先求出函数模型,然后利用残差分析的方法来比较模型的好坏.二、讲授
14、新课:1.教学残差分析:残差:样本值与回归值的差叫残差,即iiieyy.残差分析:通过残差来判断模型拟合的效果,判断原始数据中是否存在可疑数据,这方面的分析工作称为残差分析.残差图:以残差为横坐标,以样本编号,或身高数据,或体重估计值等为横坐标,作出的图形称为残差图.观察残差图,如果残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,这样的带状区域的宽度越窄,模型拟合精度越高,回归方程的预报精度越高.2.例 3 中的残差分析:计算两种模型下的残差 一般情况下,比较两个模型的残差比较困难(某些样本点上一个模型的残差的绝对值比另一个模型的小,而另一些样本点的情况则相反),故通过比较两个模
15、型的残差的平方和的大小来判断模型的拟合效果.残差平方和越小的模型,拟合的效果越好.由于两种模型下的残差平方和分别为 1450.673 和 15448.432,故选用指数函数模型的拟合效果远远优于选用二次函数模型.(当然,还可用相关指数刻画回归效果)3.小结:残差分析的步骤、作用 三、巩固练习:练习:教材 P13 第 1 题 t 441 529 625 729 841 1024 1225 y 7 11 21 24 66 115 325 0100200300400050010001500ty学难点解释残差变量的含义了解偏差平方和分解的思想教学过程一复习确定性关系回归分析是对具有相关关系的两个变量进行统计分析的一种身高体重求根据一名女大学生的身高预报她的体重的回归方程并预报一