《回归分析的基本思想.ppt》由会员分享,可在线阅读,更多相关《回归分析的基本思想.ppt(39页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、回归分析的基本思想现在学习的是第1页,共39页3.1回归分析的基回归分析的基本思想及其初步本思想及其初步应用(一)应用(一)高二数学高二数学 选修选修2-3 现在学习的是第2页,共39页2023/4/1两个变量的关系两个变量的关系不相关不相关相关关系相关关系函数关系函数关系线性相关线性相关非线性相关非线性相关现实生活中两个变量间的关系现实生活中两个变量间的关系:相关关系相关关系:对于两个变量,当自变量取值一定时,因变:对于两个变量,当自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系量的取值带有一定随机性的两个变量之间的关系.函数关系中的两个变量间是一种确定性关系函数关系中的两个
2、变量间是一种确定性关系相关关系是一种非确定性关系相关关系是一种非确定性关系函数关系是一种理想的关系模型函数关系是一种理想的关系模型相关关系在现实生活中大量存在,是更一般的情况相关关系在现实生活中大量存在,是更一般的情况现在学习的是第3页,共39页表示有一组具体的数据估计得到的截距和斜率表示有一组具体的数据估计得到的截距和斜率;a,b,y表示真实值表示真实值;表示由真实值表示由真实值a,b所确定的值所确定的值.表示由估计值表示由估计值 所确定的值所确定的值.现在学习的是第4页,共39页这种方法称为回归分析这种方法称为回归分析.两个具有线性相关关系的变量的统计分析:两个具有线性相关关系的变量的统计
3、分析:(1)画散点图;)画散点图;(2)求回归直线方程)求回归直线方程(最小二乘法最小二乘法):(3)利用回归直线方程进行预报;)利用回归直线方程进行预报;回归分析回归分析是对具有相关关系的两个变量进行统计分析的一种是对具有相关关系的两个变量进行统计分析的一种常用方法常用方法.为样本点的中心为样本点的中心样本点:样本点:现在学习的是第5页,共39页 2008年年5月,中共中央国务院关于加强青月,中共中央国务院关于加强青少年体育、增强青少年体质的意见指出城少年体育、增强青少年体质的意见指出城市超重和肥胖青少年的比例明显增加市超重和肥胖青少年的比例明显增加.“身高标准体重身高标准体重”该指标对于学
4、生形成正确该指标对于学生形成正确的身体形态观具有非常直观的教育作用的身体形态观具有非常直观的教育作用.“身高标准体重身高标准体重”从何而来?我们怎样去从何而来?我们怎样去研究研究?创设情境:创设情境:现在学习的是第6页,共39页某大学中随机选取某大学中随机选取8名女大学生,其身高和体重数据如下名女大学生,其身高和体重数据如下表所示表所示.编号编号1 12 23 34 45 56 67 78 8身高身高/cm/cm165165165165157157170170175175165165155155170170体重体重/kg/kg48485757505054546464616143435959求根
5、据女大学生的身高预报体重的回归方程,并预报一名身求根据女大学生的身高预报体重的回归方程,并预报一名身高为高为172cm的女大学生的体重的女大学生的体重.现在学习的是第7页,共39页解:取身高为解释变量解:取身高为解释变量x,体重为预报变量,体重为预报变量y,作散点图:,作散点图:样本点呈条状分布,身高和体重有较好的线性相关关系,样本点呈条状分布,身高和体重有较好的线性相关关系,因此可以用回归方程来近似的刻画它们之间的关系因此可以用回归方程来近似的刻画它们之间的关系.现在学习的是第8页,共39页由由得:得:故所求回归方程为:故所求回归方程为:因此,对于身高因此,对于身高172cm的女大学生,由回
6、归方程可以预报的女大学生,由回归方程可以预报其体重为:其体重为:是斜率的估计值,说明身高是斜率的估计值,说明身高x每增加每增加1个单个单位时,体重位时,体重y就增加就增加0.849个单位,这表明体个单位,这表明体重与身高具有正的线性相关关系重与身高具有正的线性相关关系.如何描述它们之间线性相关关系的强弱?如何描述它们之间线性相关关系的强弱?现在学习的是第9页,共39页相关系数相关系数相关系数的性质相关系数的性质(1)|r|1(1)|r|1(2)|r|(2)|r|越接近于越接近于1 1,相关程度越强;,相关程度越强;|r|r|越接近于越接近于0 0,相关,相关程度越弱程度越弱注注:b:b 与与
7、r r 同号同号问题:达到怎样程度,问题:达到怎样程度,x x、y y线性相关呢?它们的相关程度线性相关呢?它们的相关程度怎样呢?怎样呢?r现在学习的是第10页,共39页相关系数相关系数正相关;负相关正相关;负相关通常:通常:r r-1,-0.75-1,-0.75-负相关很强负相关很强;r r0.75,10.75,1正相关很强正相关很强;r r-0.75,-0.3-0.75,-0.3-负相关一般负相关一般;r r0.3,0.750.3,0.75正相关一般正相关一般;r r-0.25,0.25-0.25,0.25-相关性较弱相关性较弱;对对r r进行显进行显著性检验著性检验 r现在学习的是第11
8、页,共39页某大学中随机选取某大学中随机选取8名女大学生,其身高和体重数据如名女大学生,其身高和体重数据如下表所示下表所示.编号编号1 12 23 34 45 56 67 78 8身高身高/cm/cm165165165165157157170170175175165165155155170170体重体重/kg/kg48485757505054546464616143435959求根据女大学生的身高预报体重的回归方程,并预报一名求根据女大学生的身高预报体重的回归方程,并预报一名身高为身高为172cm的女大学生的体重的女大学生的体重.故所求回归方程为:故所求回归方程为:r=0.798 表明体重与身
9、高有很强的线性相关性,从而表明体重与身高有很强的线性相关性,从而说明我们建立的回归模型是有意义的说明我们建立的回归模型是有意义的.认为她的平均体重的估计值是认为她的平均体重的估计值是60.316kg.现在学习的是第12页,共39页因为所有的样本点不共线,所以线性函数模型只能近似地刻画因为所有的样本点不共线,所以线性函数模型只能近似地刻画身高和体重之间的关系,即:体重不仅受身高的影响,还受其身高和体重之间的关系,即:体重不仅受身高的影响,还受其他因素的影响,把这种影响的结果用他因素的影响,把这种影响的结果用e来表示,从而把线性函来表示,从而把线性函数模型修改为线性回归模型:数模型修改为线性回归模
10、型:y=bx+a+e.其中,其中,e包含体重不包含体重不能由身高的线性函数解释的所有部分能由身高的线性函数解释的所有部分.现在学习的是第13页,共39页线性回归模型线性回归模型其中其中a a和和b b为模型的未知参数,为模型的未知参数,e e是是y y与与之间的误差,通常之间的误差,通常e e为随机变量为随机变量,称为,称为随机误差随机误差.均值均值E(e)=0,方差,方差D(e)=20线性回归模型的完整表达式为:线性回归模型的完整表达式为:线性回归模型适用范围比一次函数的适用范围大得多线性回归模型适用范围比一次函数的适用范围大得多.当随机当随机误差误差e恒等于恒等于0时,线性回归模型就变成一
11、次函数模型时,线性回归模型就变成一次函数模型.即:即:一次函数模型是线性回归模型的特殊形式,线性回归模型是一次函数模型是线性回归模型的特殊形式,线性回归模型是一次函数模型的一般形式一次函数模型的一般形式.现在学习的是第14页,共39页随机误差是引起预报值随机误差是引起预报值 与真实值与真实值y之间的误差的原因之间的误差的原因之一,其大小取决于随机误差的方差之一,其大小取决于随机误差的方差.和和 为截距和斜率的估计值,它们与真实值为截距和斜率的估计值,它们与真实值a和和b之间之间存在误差是引起预报值存在误差是引起预报值 与真实值与真实值y之间的误差的另一之间的误差的另一个原因个原因.现在学习的是
12、第15页,共39页随机误差随机误差e的主要来源:的主要来源:(1)用线性回归模型近似真实模型用线性回归模型近似真实模型(真实模型是客观存在(真实模型是客观存在的,但我们并不知道到底是什么)的,但我们并不知道到底是什么)所引起的误差所引起的误差.可能存在可能存在非线性的函数能更好的描述非线性的函数能更好的描述y与与x之间的关系,但我们现在之间的关系,但我们现在却用线性函数来表述这种关系,结果就产生误差,这种由却用线性函数来表述这种关系,结果就产生误差,这种由于模型近似所引起的误差包含在于模型近似所引起的误差包含在e中中.(2)忽略了某些因素的影响忽略了某些因素的影响.影响变量影响变量y的因素不止
13、变量的因素不止变量x一个,可能还有其他因素,但通常它们每一个因素的影响一个,可能还有其他因素,但通常它们每一个因素的影响可能都比较小,它们的影响都体现在可能都比较小,它们的影响都体现在e中中.(3)观测误差观测误差.由于测量工具等原因,得到的由于测量工具等原因,得到的y的观测值一般的观测值一般是有误差的,这样的误差也包含在是有误差的,这样的误差也包含在e中中.以上三项误差越小,则回归模型的拟合效果越好以上三项误差越小,则回归模型的拟合效果越好.现在学习的是第16页,共39页在线性回归模型中,在线性回归模型中,e是用是用 预报真实值预报真实值y的误差,它的误差,它是一个不可观测的量,那么该怎样研
14、究随机误差,如是一个不可观测的量,那么该怎样研究随机误差,如何衡量预报的精度?何衡量预报的精度?由于随机误差由于随机误差e的均值为的均值为0,故采用方差,故采用方差 来衡量随机来衡量随机误差的大小误差的大小.现在学习的是第17页,共39页 假设假设 1:身高和随机误差的不同不会对体重产生任何影响,身高和随机误差的不同不会对体重产生任何影响,54.554.554.554.554.554.554.554.5体重/kg170155165175170157165165身高/cm87654321编号54.5kg怎样研究随机误差?怎样研究随机误差?现在学习的是第18页,共39页59436164545057
15、48体重/kg170155165175170157165165身高/cm87654321编号 例如,编号为例如,编号为6的女大学生的体重并没有落在水平直线上,她的体的女大学生的体重并没有落在水平直线上,她的体重为重为61kg。解释变量(身高)和随机误差共同把这名学生的体重从。解释变量(身高)和随机误差共同把这名学生的体重从54.5kg“推推”到了到了61kg,相差,相差6.5kg,所以,所以6.5kg是解释变量和随机误差是解释变量和随机误差的的组合效应组合效应。用这种方法可以对所有预报变量计算组合效应。用这种方法可以对所有预报变量计算组合效应。数学上,把每个效应(观测值减去总的平均值)的平方加
16、起来,即用数学上,把每个效应(观测值减去总的平均值)的平方加起来,即用表示总的效应,称为表示总的效应,称为总偏差平方和总偏差平方和。现在学习的是第19页,共39页5943616454505748体重/kg170155165175170157165165身高/cm87654321编号 假设假设2:随机误差对体重没有影响,也就是说,体重仅受身高的影响,那么散点图随机误差对体重没有影响,也就是说,体重仅受身高的影响,那么散点图中所有的点将完全落在回归直线上。中所有的点将完全落在回归直线上。怎样研究随机误差?怎样研究随机误差?现在学习的是第20页,共39页 因此,数据点和它在回归直线上相应位置的差异因
17、此,数据点和它在回归直线上相应位置的差异 是随机误差的效应,是随机误差的效应,称称 为为残差残差。例如,编号为例如,编号为6的女大学生,计算随机误差的效应(残差)为:的女大学生,计算随机误差的效应(残差)为:对每名女大学生计算这个差异,然后分别将所得的值平方后加起来,用数学符号对每名女大学生计算这个差异,然后分别将所得的值平方后加起来,用数学符号称为称为残差平方和残差平方和,它代表了随机误差的效应。它代表了随机误差的效应。表示为:表示为:现在学习的是第21页,共39页随机误差随机误差e的估计量的估计量样本点:样本点:相应的随机误差为:相应的随机误差为:随机误差的估计值为:随机误差的估计值为:称
18、为相应于点称为相应于点 的的残差残差.的估计量的估计量为为称为称为残差平方和残差平方和.现在学习的是第22页,共39页残差分析残差分析在研究两个变量间的关系时,首先要根据散点图来粗在研究两个变量间的关系时,首先要根据散点图来粗略判断它们是否是线性相关,是否可以用线性回归模略判断它们是否是线性相关,是否可以用线性回归模型来拟合数据型来拟合数据.然后,可以通过残差然后,可以通过残差 来来判断模型拟合的效果,判断原始数据中是否存在可疑判断模型拟合的效果,判断原始数据中是否存在可疑数据数据.这方面的分析工作称为残差分析这方面的分析工作称为残差分析.现在学习的是第23页,共39页0.3820.382-2
19、.883-2.8836.6276.6271.1371.137-4.618-4.6182.4192.4192.6272.627-6.373-6.373残差残差59594343616164645454505057574848体重体重/kg/kg170170155155165165175175170170157157165165165165身高身高/cm/cm8 87 76 65 54 43 32 21 1编号编号下表为女大学生身高和体重的原始数据以及相应的残下表为女大学生身高和体重的原始数据以及相应的残差数据:差数据:e以纵坐标为残差,横坐标为编号,作出图形(以纵坐标为残差,横坐标为编号,作出图形
20、(残差图残差图)来分)来分析残差特性析残差特性.现在学习的是第24页,共39页 问题:问题:如何发现数据中的错误?如何发现数据中的错误?(1)我们可以通过分析发现原始数据中的可疑数据,判断建立模型的拟合效果。我们可以通过分析发现原始数据中的可疑数据,判断建立模型的拟合效果。现在学习的是第25页,共39页 残差图的制作和作用:残差图的制作和作用:制作:坐标纵轴为残差变量,横轴可以有不同的选择.横轴为编号:可以考察残差与编号次序之间的关系,常用于调查数据错误.横轴为解释变量:可以考察残差与解释变量的关系,常用于研究模型是否有改进的余地.作用:判断模型的适用性若模型选择的正确,残差图中的点应该分布在
21、以横轴为中心的带形区域.问题:问题:如何发现数据中的错误?如何发现数据中的错误?现在学习的是第26页,共39页残差图的制作及作用。残差图的制作及作用。坐标纵轴为残差变量,横轴可以有不同的选择;坐标纵轴为残差变量,横轴可以有不同的选择;若模型选择的正确,残差图中的点应该分布在以横轴为若模型选择的正确,残差图中的点应该分布在以横轴为心的带形区域心的带形区域;对于远离横轴的点,要特别注意对于远离横轴的点,要特别注意。身高与体重残差图异常点 错误数据 模型问题 几点说明:几点说明:第一个样本点和第第一个样本点和第6个样本点的残差比较大,需要确认在采集过程中是否有人为的错误。个样本点的残差比较大,需要确
22、认在采集过程中是否有人为的错误。如果数据采集有错误,就予以纠正,然后再重新利用线性回归模型拟合数据;如果数据采集如果数据采集有错误,就予以纠正,然后再重新利用线性回归模型拟合数据;如果数据采集没有错误,则需要寻找其他的原因。没有错误,则需要寻找其他的原因。另外,残差点比较均匀地落在水平的带状区域中,说明选用的模型计较合适,这样的带状区域的宽度另外,残差点比较均匀地落在水平的带状区域中,说明选用的模型计较合适,这样的带状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高。越窄,说明模型拟合精度越高,回归方程的预报精度越高。现在学习的是第27页,共39页我们可以用我们可以用相关指数相关指
23、数R2来刻画回归的效果,其计算公式是来刻画回归的效果,其计算公式是如何衡量预报的精度?如何衡量预报的精度?显然,显然,R2的值越大,说明残差平方和越小,也就是说模型拟合效果越好。的值越大,说明残差平方和越小,也就是说模型拟合效果越好。如果某组数据可能采取几种不同回归如果某组数据可能采取几种不同回归方程进行回归分析,则可以通过比较方程进行回归分析,则可以通过比较R2的值来做出选择,即选取的值来做出选择,即选取R2较大的模型较大的模型作为这组数据的模型。作为这组数据的模型。现在学习的是第28页,共39页 1354总计0.36128.361残差变量0.64225.639随机误差比例平方和来源 从上中
24、可以看出,解析变量对总效应约贡献了从上中可以看出,解析变量对总效应约贡献了64%,即,即R2 0.64,可以叙述为,可以叙述为“身高解析了身高解析了64%的体重变化的体重变化”,而随机误,而随机误差贡献了剩余的差贡献了剩余的36%。所以,身高对体重的效应比随机误差的效应大得多。所以,身高对体重的效应比随机误差的效应大得多。问题:问题:如何衡量随机模型的拟合效果?如何衡量随机模型的拟合效果?下面我们用相关指数分析一下例下面我们用相关指数分析一下例1:现在学习的是第29页,共39页 问题:结合例问题:结合例1思考:用回归方程预报体重时应注意什么?思考:用回归方程预报体重时应注意什么?用身高预报体重
25、时应注意的问题:用身高预报体重时应注意的问题:1.回归方程只适用于我们所研究的样本的总体。回归方程只适用于我们所研究的样本的总体。2.我们建立的回归方程一般都有时间性。我们建立的回归方程一般都有时间性。3.样本取值的范围会影响回归方程的适用范围。样本取值的范围会影响回归方程的适用范围。4.不能期望回归方程得到的预报值就是预报变量的精确值。不能期望回归方程得到的预报值就是预报变量的精确值。涉及到统计的一些思想:涉及到统计的一些思想:模型适用的总体;模型的时间性;模型适用的总体;模型的时间性;样本的取值范围对模型的影响;模型预报结果的正确理解。样本的取值范围对模型的影响;模型预报结果的正确理解。现
26、在学习的是第30页,共39页 一般地,建立回归模型的基本步骤为:一般地,建立回归模型的基本步骤为:(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量。)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量。(2)画出确定好的解释变量和预报变量的散点图,观察它们之间的关系)画出确定好的解释变量和预报变量的散点图,观察它们之间的关系 (如是否存在线性关系等)。(如是否存在线性关系等)。(3)由经验确定回归方程的类型(如我们观察到数据呈线性关系,则选用线性回归方程)由经验确定回归方程的类型(如我们观察到数据呈线性关系,则选用线性回归方程y=bx+a).(4)按一定规则估计回归方程中的
27、参数(如最小二乘法)。)按一定规则估计回归方程中的参数(如最小二乘法)。(5)得出结果后分析残差图是否有异常(个别数据对应残差过大,或残差呈现不随机)得出结果后分析残差图是否有异常(个别数据对应残差过大,或残差呈现不随机的规律性,等等),若存在异常,则检查数据是否有误,或模型是否合适等。的规律性,等等),若存在异常,则检查数据是否有误,或模型是否合适等。问题:问题:归纳建立回归模型的基本步骤。归纳建立回归模型的基本步骤。现在学习的是第31页,共39页 问题六:问题六:若两个变量呈现非线性关系,如何解决?(分析例若两个变量呈现非线性关系,如何解决?(分析例2)例例2 一只红铃虫的产卵数一只红铃虫
28、的产卵数y和温度和温度x有关。现收集了有关。现收集了7组观测数据列于表中:组观测数据列于表中:温度温度xoC21232527293235产卵数产卵数y/个个711212466115325(1 1)试建立产卵数)试建立产卵数y y与温度与温度x x之间的回归方程;并预测温度为之间的回归方程;并预测温度为2828o oC C时产卵数目。时产卵数目。(2 2)你所建立的模型中温度在多大程度上解释了产卵数的变化?)你所建立的模型中温度在多大程度上解释了产卵数的变化?现在学习的是第32页,共39页 选变量选变量 解:选取气温为解释变量解:选取气温为解释变量x x,产卵数,产卵数 为预报变量为预报变量y
29、y。画散点图画散点图假设线性回归方程为假设线性回归方程为:=bx+a选选 模模 型型分析和预测分析和预测当当x=28时,时,y=19.8728-463.73 93估计参数估计参数由计算器得:线性回归方程为由计算器得:线性回归方程为y=y=19.8719.87x x-463.73-463.73 相关指数相关指数R R2 2=r r2 20.8640.8642 2=0.7464=0.7464所以,一次函数模型中温度解释了所以,一次函数模型中温度解释了74.64%的产卵数变化。的产卵数变化。050100150200250300350036912151821242730333639当当x=28时,时,
30、y=19.8728-463.73 93方方法法一一:一一元元函函数数模模型型问题六:问题六:若两个变量呈现非线性关系,如何解决?(分析例若两个变量呈现非线性关系,如何解决?(分析例2)现在学习的是第33页,共39页 y=c1 x2+c2 变换变换 y=c1 t+c2 非线性关系非线性关系 线性关系线性关系问题问题选用选用y=c1x2+c2,还是,还是y=c1x2+cx+c2?问题问题3 产卵数产卵数气气温温问题问题2如何求如何求c1、c2?t=x2方方法法二二,二二元元函函数数模模型型问题六:问题六:若两个变量呈现非线性关系,如何解决?(分析例若两个变量呈现非线性关系,如何解决?(分析例2)现
31、在学习的是第34页,共39页 平方变换平方变换:令令t=xt=x2 2,产卵数,产卵数y y和温度和温度x x之间二次函数模型之间二次函数模型y=bxy=bx2 2+a+a就转化为产卵数就转化为产卵数y y和温度的平方和温度的平方t t之间线性回归模型之间线性回归模型y=bt+ay=bt+a温度温度21232527293235温度的平方温度的平方t44152962572984110241225产卵数产卵数y/个个711212466115325作作散散点点图图,并并由由计计算算器器得得:y y和和t t之之间间的的线线性性回回归归方方程程为为y=y=0.3670.367t t-202.54-20
32、2.54,相关指数,相关指数R R2 2=r r2 20.8960.8962 2=0.802=0.802将将t=xt=x2 2代入线性回归方程得:代入线性回归方程得:y=y=0.3670.367x x2 2-202.54-202.54当当x x=28=28时时,y y=0.36728=0.367282 2-202.5485202.5485,且,且R R2 2=0.802=0.802,所以,二次函数模型中温度解所以,二次函数模型中温度解释了释了80.2%80.2%的产卵数变化。的产卵数变化。t问题六:问题六:若两个变量呈现非线性关系,如何解决?(分析例若两个变量呈现非线性关系,如何解决?(分析例
33、2)现在学习的是第35页,共39页 产卵数产卵数气气温温 变换变换 y=bx+a 非线性关系非线性关系 线性关系线性关系对数对数问题六:问题六:若两个变量呈现非线性关系,如何解决?(分析例若两个变量呈现非线性关系,如何解决?(分析例2)方法三:指数函数模型现在学习的是第36页,共39页 温度温度xoC21232527293235z=lgy0.851.041.321.381.822.062.51产卵数产卵数y/个个711212466115325xz当当x=28x=28o oC C 时,时,y 44 y 44,指数回归模,指数回归模型中温度解释了型中温度解释了98%98%的产卵数的变化的产卵数的变
34、化由计算器得:由计算器得:z z关于关于x x的线性回归方程的线性回归方程为为z=0.272z=0.272x x-3.849-3.849,相关指数相关指数R R2 2=r r2 20.99250.99252 2=0.98=0.98 对数变换:在对数变换:在 中两边取自然对数得中两边取自然对数得令令 ,则,则 就转换为就转换为z z=bx+a=bx+a问题六:问题六:若两个变量呈现非线性关系,如何解决?(分析例若两个变量呈现非线性关系,如何解决?(分析例2)现在学习的是第37页,共39页 函数模型函数模型相关指数相关指数R2线性回归模型线性回归模型0.7464二次函数模型二次函数模型0.802指
35、数函数模型指数函数模型0.98最好的模型是哪个最好的模型是哪个?显然,指数函数模型最好!显然,指数函数模型最好!问题六:问题六:若两个变量呈现非线性关系,如何解决?(分析例若两个变量呈现非线性关系,如何解决?(分析例2)现在学习的是第38页,共39页 课堂知识延伸课堂知识延伸 我们知道,刑警如果能在案发现场提取到罪犯的脚印,即将获得一条重要的破我们知道,刑警如果能在案发现场提取到罪犯的脚印,即将获得一条重要的破案线索,其原因之一是人类的脚掌长度和身高存在着相关关系,可以根据一个人的案线索,其原因之一是人类的脚掌长度和身高存在着相关关系,可以根据一个人的脚掌长度来来预测他的身高脚掌长度来来预测他
36、的身高 我们还知道,在统计史上,很早就有人收集过人们的身高、前臂长度等数据,我们还知道,在统计史上,很早就有人收集过人们的身高、前臂长度等数据,试图寻找这些数据之间的规律试图寻找这些数据之间的规律 在上述两个小故事的启发下,全班同学请分成一些小组,每组在上述两个小故事的启发下,全班同学请分成一些小组,每组4-6名同学,在老名同学,在老师的指导下,开展一次数学建模活动,来亲自体验回归分析的思想方法,提高自己的师的指导下,开展一次数学建模活动,来亲自体验回归分析的思想方法,提高自己的实践能力。实践能力。数学建模的题目是:收集一些周围人们的脚掌长度、前臂长度中的一个数据及其数学建模的题目是:收集一些
37、周围人们的脚掌长度、前臂长度中的一个数据及其身高,来作为两个变量画散点图,如果这两个变量之间具有线性相关关系,就求出回身高,来作为两个变量画散点图,如果这两个变量之间具有线性相关关系,就求出回归直线方程,另选一个人的这两个变量的数据,作一次预测,并分析预测结果。归直线方程,另选一个人的这两个变量的数据,作一次预测,并分析预测结果。最后以小组写出数学建模报告,报告要求过程清晰,结论明确,有关数学论述准最后以小组写出数学建模报告,报告要求过程清晰,结论明确,有关数学论述准确,以下两个问题需要注意:确,以下两个问题需要注意:(1)如果脚掌长度不方便,可改量脚印的长度。)如果脚掌长度不方便,可改量脚印的长度。(2)数据尽量取得分散一些。)数据尽量取得分散一些。现在学习的是第39页,共39页