《回归分析的基本思想及其初步(1) 教学设计.docx》由会员分享,可在线阅读,更多相关《回归分析的基本思想及其初步(1) 教学设计.docx(11页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、 3.1回归分析的基本思想及其初步(1)【学情分析】:教学对象是高二理科学生,学生已经初步学会用最小二乘法建立线性回归模型的知识, 并能用所学知识解决一些简单的实际问题。回归分析是数理统计中的重要内容,在教学中, 要结合实例进行相关性检验,理解只有两个变量相关性显著时,回归方程才具有实际意义。 在起点低的班级中注重让学生参与实践,结合画图表的方法整理数据,鼓励学生通过收集数 据,经历数据处理的过程,从而认识统计方法的特点,达到学习的目的。【教学目标】:(1)知识与技能:回忆线性回归模型与函数模型的差异,理解用最小二乘法求回归模型 的步骤,了解判断两变量间的线性相关关系的强度一一相关系数。(2)
2、过程与方法:本节内容先从大学中女大学生的甚高和体重之间的关系入手,求出相 应的回归直线方程。(3)情感态度与价值观:从实际问题中发现自己已有知识的不足之处,激发学生的好奇 心和求知欲,培养学生不满足于已有知识,勇于求知的良好个 性品质,引导学生积极进取。【教学重点】:1. 了解线性回归模型与函数模型的差异;了解两变量间的线性相关关系的强度一一相关系数。【教学难点】:1. 了解两变量间的线性相关关系的强度一一相关系数;了解线性回归模型与一次函数模型的差异。【教学过程设计】:教学环节教学活动设计意图一、创设情境问题一:一般情况下,体重与身高有一定的关系,通常个子较图的 人体重比较大,但这是否一定正
3、确?(是否存在普遍性)师:提出问题,引导学生判断体重与身高之间的关系(函数关 系、相关关系)生:思考、讨论。问题二:统计方法解决问题的基本过程是什么?复习回归 分析用于解决 什么样的问 题。(2)经计算可得1111117 = 46.36,亍=19.45,1二36750,Zy: =5442,0% = 13910. i=Z=1/=111 _13910 11x46.36x19.4536750-11 x46.36213910 11x46.36x19.4536750-11 x46.3620.3,Ze-Ux”4个/=1斫亍一片=19.450.3X46.36 处 5.542.A故所求的线性回归方程为y =0
4、.3汁5.542.师:提出问题,引导学生回忆用最小二乘法求回归直线方程的 方法。生:回忆、叙述回归分析的基本过程:画出两个变量的散点图;判断是否线性相关求回归直线方程(利用最小二乘法)并用回归直线方程进行预报复习回归 分析的解题步 骤二、例题探究活动:对于一组具有线性相关的数据复习统计选讲(X,yi) , (x2,y2),(x,y“),我们知道其回归方程的截距和斜率的最小二乘估计公式分别为:a = y+bx,方法解决问题 的基本过程。 - -A ZB x)(x )力二月F区X)2Z=1一 -172- -其中X/,%,(x, y)称为样本点的中心。你能推导及 /=1n /=1学生动手 画散点图,
5、老出这两个计算公式吗?师用EXCEL的从已经学过的知识我们知道,截距展和斜率,分别是使Q (Q, B )二(y.-外.-夕)2取最小值时a , B的值。/=1作图工作演 示,并引导学 生找出两个变由于Q( a , B ):自y i 一- (y廿x) + (y。Q - a 2i=l”取一一B4一风一(y BQ(y- 0x) - a式y- px)-a 27量之间的关 系。=2 , 一段,一()一分x)J2 +2y z-pxi -y-Px)y-/3x-a) +/=1Z=1学生经历 数据处理的过 程,并借助n(y-6 1-a)2,注意到至yBQ(y_0xa)i=( y-/3x-a 白丫凯 -(y-BQ
6、 /=1-;l-=(y_0x_a ) Zx(y_x)i=ii=l ( y. /3x- a) n y- n/3x- n(y- /3x) =0,所以Q( a , B)二回y i - /3xi - (y- p x)J2 + n(y_xa) 2 i=之 (x,7)2- 2B (为一次)(%-)0 + (y一4 /=1z=lZ=1+n (y-J3xa)2 _ _%)(%-y)-n(y (3x a)2 +x)千 J2/=,S(x,.-x)2/=1x)(-2-一:+ Z(2,(七-X)2日/=1在上式中,后两项和a, 8无关,而前两项为非负数,因此要Q取得最小值,当且仅当前两项的值均为0,即有 _ _Z (
7、七-x)(y -y)z,(七 一1)2 i=la = y一 x.这正是我们所要推导的公式。EXCEL的统计 功能鼓励学生 使用计算器或 计算机等现代 工具来处理数 据。下面我们通过案例,进一步学习学习回归分析的基本思想及其 应用。问题三:思考例1:从某大学中随机选取8名女大学生,其身高和 体重数据如表所示。求根据一名女大学生的身高预报她的体重的回 归方程,并预报一名身高为172cm的女大学生的体重。体重/kg4857505464614359题目中表达了哪些信息?师:读例1的要求,引导学生理解例题含义。(例题含义:数据体重与身高之间是一种不确定性的关系求出以身高为自变量,体重为因变量y的回 归方
8、程。由方程求出当工=172时,y的值。生:思考、讨论、叙述自己的理解,归纳出题目中的信息。根据以前所学的知识,让学生自己动手求出回归方程求解过程如下:画出散点图,判断身高工与体重y之间存在什么关系(线性 关系)?7016517016517017518065 60 55 50 45 40 1150155160列表求出相关的量,并求出线性回归方程编号12345678身画cm1651651571 701 751651551 70体重/kg485750546461 J4359xtyi79209405785091801120010065666510030Xi2 27225 27225 24649 289
9、00 30625 27225 24025 28900T = 165. 25V = 54. 5g X.2 = 218774y = 72315V x, y. -nxy加二八一七 m72315 - 8x165.25x54.5 n O/IO代入公式有b = 3=- x 0.848/ 2-2218774 -8xl65.2522xi -nx i=a = y-bx 54.5 - 0.849 x 165.25 = -85.712所以回归方程为$ = 6 +%=0.849%-85.712利用回归方程预报身高172cm的女大学生的体重约为多 少?当 = 172 时,9 = 0.849x172 85.712 = 6
10、0.316 仇 g)引导学生复习总结求线性回归方程的步骤:第一步:作散点图一-第二步:求回归方程-第三步:代值 计算三、探究新知引导学生 了解线性回归 模型与一次函 数的不同问题四:身高为172cm的女大学生的体重一定是60.316kg吗?(不一定,但一般可以认为她的体重在60.316kg左右.)师:提出问题,引导学生比较函数模型与线性回归模型的不同, 并引出相关系数的作用。生:思考、讨论、解释解释线性回归模型与一次函数的不同从散点图可观察出,女大学生的体重y和身高l之间的关系并 不能用一次函数y =云+ ”来严格刻画(因为所有的样本点不共线, 所以线性模型只能近似地刻画身高和体重的关系).在
11、数据表中身 高为165cm的3名女大学生的体重分别为48kg、57kg和61kg,如果能用一次函数来描述体重与身高的关系,那么身高为165cm的3 名女在学生的体重应相同.这就说明体重不仅受身高的影响还受 其他因素的影响,把这种影响的结果e (即残差变量或随机变量) 引入到线性函数模型中,得到线性回归模型y = fex + a + e,其中残差 变量e中包含体重不能由身高的线性函数解释的所有部分.当残差 变量恒等于0时,线性回归模型就变成一次函数模型.因此,一次 函数模型是线性回归模型的特殊形式,线性回归模型是一次函数模 型的一般形式.问题五:如何衡量两个变量之间线性相关关系的强弱呢?(项一以
12、y-歹)相关系数:r= 11Jz(x,-x)2t(x-y)2 V 曰i=i相关系数的绝对值越接近于1,两个变量的线性相关关系越强, 它们的散点图越接近一条直线,这时用线性回归模型拟合这组数据 就越好,此时建立的线性回归模型是有意义;相关系数的绝对值越 接近于0,两个变量的线性相关关系几乎不存在,它们的散点图越 离散,通常当大于0.75时,认为两个变量有很强的线性相关关系。 问题六:例1中由体重与身高建立的线性相关关系有无意义?生:动手计算本例中两个变量之间的相关系数,r = 0.798,表 明体重与身高有很强的线性相关关系,从而表明我们建立的回归模 型是有意义的。引导学生 在解决具体问 题的过
13、程中, 通常先进行相 关性的检验, 确认两变量间 的线性相关关 系的强弱再求 线性回归方 程。结合实例 的分析和研 究,正确地进 行相关性检 验。四、巩固练习1.假设关于某设备的使用年限X和支出的维修费用y 如下表的统计资料。试求:(万元),有巩固知识使用年限X23456维修费用y2.23.85.56.57.0画出数据的散点图;若X与y呈线性相关关系,求线性回归方程y = bx + a的回归系数、b估计使用年限为10年时,维修费用是多少?由已知条件制成下表:112345xi23456Xi2.23.85.56.57.0匕%4.411.422.032.542.02 七49162536% = 4 ;
14、y = 5 ;x二90; 毛%=112.3z=l/=1于是有篇答案:散点图如图6成=5 1.23x4 = 0.08 回归直线方程是9 = L23x + 0.08, 当x = 10时,y = L23xl0 + 0.08 = 12.38 (万元)即估计使用10年时维修费用是12. 38万元。五、小结反思归纳1 .熟练掌握求线性回归方程的步骤;画出两个变量的散点图; 判断是否线性相关;求回归直线方程(利用最小二乘法);并用回归直线方程进行预报。2 .理解线性回归模型与一次函数的不同;一次函数模型是线性回归模型的特殊形式,线性回归模型是一 次函数模型的一般形式.3 . 了解相关系数的计算与解释。(%,
15、一双 一歹)相关系数:一 I源Jz(x,-x)2t(x-y)2 V i=li=i相关系数的绝对值越接近于1,两个变量的线性相关关系越强, 它们的散点图越接近一条直线,这时用线性回归模型拟合这组数据 就越好,此时建立的线性回归模型是有意义;相关系数的绝对值越 接近于0,两个变量的线性相关关系几乎不存在,它们的散点图越 离散,通常当大于0.75时,认为两个变量有很强的线性相关关系。 练习与测试.设有一个回归方程为$ = 2-2.5尤,则变量增加一个单位时,则(C )A. y平均增加2.5个单位B. y平均增加2个单位C. y平均减少2.5个单位D. y平均减少2个单位.在画两个变量的散点图时,下面
16、哪个叙述是正确的(B )A.预报变量在轴上,解释变量在y轴上B.解释变量在轴上,预报变量在y轴上C.可以选择两个变量中任意一个变量在轴上D.可以选择两个变量中任意一个变量在y轴上.已知九与y之间的一组数据:X0123y1357则y与x的线性回归方程为y = hx +a必过(D )A. (2, 2)点 B. (1.5, 0)点 C. (1, 2)点 D. (1.5, 4)点.已知两个相关变量与y具有线性相关关系,当取值1, 2, 3, 4时,通过观测得到y的 值分别为1.2, 4.9, 8. 1, 12.8,这组样本点的中心是(D )A. (2, 4.9) B. (3, 8. 1) C. (2.
17、5, 7) D. (2.5, 6. 75). 一位母亲记录了儿子39岁的身高,数据(略),由此建立的身高与年龄的回归模型为 y=7.19X+73.93,用这个模型预测这个孩子10岁时的身高,则正确的叙述是(C )A.身高一定是145.83cmB.身高在145.83cm以上C.身高在145.83cm左右D.身高在145.83cm以下.在一次实验中,测得(x, 丁)的四组值分别是A (1, 2)、B (2, 3)、C (3, 4) D (4, 5), 则y与l之间的回归直线方程为(A )A. y = x + B. y = x + 2C. y = 2x + D. y = x-.有下列关系:人的年龄与
18、其拥有的财富之间的关系;曲线上的点与该点的坐标之间的 关系;苹果的产量与气候之间的关系;森林中的同一树木,其横截面直径与高度之间 的关系;学生与其学号之间的关系。其中有相关关系的是。答案:.许多因素都会影响贫穷,教育也许是其中之一,在研究这两个因素的关系时,收集了美国 50个州的成年人受过9年或更少教育的百分比(x )和收入低于官方规定的贫困线的人数 占本州人数的百分比(y)的数据,建立的回归直线方程如下:y = 0.8x + 4.6。斜率的估 计等于0.8说明,成年人受过9年或更少教育的百分比(%)和收入 低于官方规定的贫困线的人数占本州人数的百分比(y )之间的相关系数 (填充”大于0 ”或”小于0 “)。答案:.若施化肥量尤与小麦产量y之间的回归直线方程为$ = 250+4x,当施化肥量为50kg时, 预计小麦产量为。解析:当 = 50时,9 = 250+50x4 = 450。答案:450小。10.在某种产品表面进行腐蚀性试验,得到腐蚀深度y与腐蚀时间/之间对应的一组数据:时间t (s)5101520304050607090120深度 y ( m)610101316171923252946(1)画出散点图;(2)求腐蚀深度y对腐蚀时间/的回归直线方程.解:(1)散点图为