2017-2018学年高中数学人教A版选修1-2创新应用教学案:第一章 1.1 回归分析的基本思想及其初步应用 .doc

上传人:荣*** 文档编号:2616976 上传时间:2020-04-24 格式:DOC 页数:17 大小:2.13MB
返回 下载 相关 举报
2017-2018学年高中数学人教A版选修1-2创新应用教学案:第一章 1.1 回归分析的基本思想及其初步应用 .doc_第1页
第1页 / 共17页
2017-2018学年高中数学人教A版选修1-2创新应用教学案:第一章 1.1 回归分析的基本思想及其初步应用 .doc_第2页
第2页 / 共17页
点击查看更多>>
资源描述

《2017-2018学年高中数学人教A版选修1-2创新应用教学案:第一章 1.1 回归分析的基本思想及其初步应用 .doc》由会员分享,可在线阅读,更多相关《2017-2018学年高中数学人教A版选修1-2创新应用教学案:第一章 1.1 回归分析的基本思想及其初步应用 .doc(17页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、核心必知1预习教材,问题导入根据以下提纲,预习教材P2P8的内容,回答下列问题(1)在数学必修3中,我们利用回归分析的方法对两个具有线性相关关系的变量进行了研究,其步骤是什么?所求出的线性回归方程是什么?提示:步骤为:画出两个变量的散点图,求回归直线方程,并用回归直线方程进行预报线性回归方程为x.(2)所有的两个相关变量都可以求回归方程吗?提示:不一定2归纳总结,核心必记(1)回归分析回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法(2)回归直线方程方程x是两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),(xn,yn)的回归方程,其中,是待定参数,其最小二乘估计

2、分别为:其中i,i,(,)称为样本点的中心(3)线性回归模型线性回归模型用ybxae来表示,其中a和b为模型的未知参数,e称为随机误差(4)刻画回归效果的方式残差把随机误差的估计值i称为相应于点(xi,yi)的残差残差图作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重估计值等,这样作出的图形称为残差图残差图法残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,这样的带状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高残差平方和残差平方和为(yii)2,残差平方和越小,模型拟合效果越好相关指数R2R21,R2表示解释变量对于预报变量变化的贡献率,R2越接近于1

3、,表示回归的效果越好问题思考(1)通过教材P2中的例1计算出的回归方程0.849x85.712可以预报身高为172 cm的女大学生的体重为60.316 kg.请问,身高为172 cm的女大学生的体重一定是60.316 kg吗?为什么?提示:不一定从散点图可以看出,样本点散布在一条直线的附近,而不是在一条直线上,所以不能用一次函数ybxa表示(2)下列说法正确的有哪些?在线性回归模型中,e是bxa预报真实值y的随机误差,它是一个可观测的量;残差平方和越小的模型,拟合的效果越好;用R2来刻画回归效果,R2越小,拟合的效果越好;在残差图中,残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适

4、,带状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高提示:e是一个不可观测的量,故不正确;R2越小,残差平方和越大,即模型的拟合效果越差,故不正确;是正确的课前反思(1)回归分析的定义是什么?如何求回归直线方程?(2)线性回归模型是什么?(3)残差、残差图的定义是什么?如何作残差图?(4)残差平方和和相关指数R2的定义是什么?它们与回归效果有什么关系?思考求线性回归方程的步骤是什么?名师指津:(1)列表表示xi,yi,xiyi,x;(2)计算,iyi;(3)代入公式计算,的值;(4)写出线性回归方程讲一讲1(链接教材P2例1)某种产品的广告费用支出x与销售额y(单位:百万元)之间

5、有如下的对应数据:x/百万元24568y/百万元3040605070(1)画出散点图;(2)求线性回归方程;(3)试预测广告费用支出为10百万元时的销售额尝试解答(1)散点图如图所示:(2)列出下表,并用科学计算器进行有关计算:i12345合计xi2456825yi3040605070250xiyi601603003005601 380x416253664145所以,5,50,145,iyi1 380.于是可得6.5,506.5517.5.所以所求的线性回归方程为6.5x17.5.(3)根据(2)中求得的线性回归方程,当广告费用支出为10百万元时,6.51017.582.5(百万元),即广告费

6、用支出为10百万元时,销售额大约为82.5百万元(1)求线性回归方程前必须判断两个变量是否线性相关,如果两个变量本身不具备相关关系,或者它们之间的相关关系不显著,那么即使求出回归方程也是毫无意义的(2)写出回归直线方程x,并用回归直线方程进行预测说明:当x取x0时,由线性回归方程可得0的值,从而可进行相应的判断练一练1某班5名学生的数学和物理成绩如下表:学生 学科成绩ABCDE数学成绩(x)8876736663物理成绩(y)7865716461(1)画出散点图;(2)求物理成绩y对数学成绩x的回归直线方程;(3)一名学生的数学成绩是96,试预测他的物理成绩解:(1)如图所示(2)因为(8876

7、736663)73.2,(7865716461)67.8,iyi8878766573716664636125 054,88276273266263227 174.所以0.625,67.80.62573.222.05.故y对x的回归直线方程是0.625x22.05.(3)x96,则0.6259622.0582,即可以预测他的物理成绩是82.思考如何用残差图、残差平方和、相关指数R2分析拟合效果?名师指津:残差图的带状区域的宽度越窄,模型拟合精度越高;残差平方和越小,模型拟合效果越好;R2越接近于1,模型拟合效果越好讲一讲2假定小麦基本苗数x与成熟期有效穗y之间存在相关关系,今测得5组数据如下:x

8、15.025.830.036.644.4y39.442.942.943.149.2(1)以x为解释变量,y为预报变量,作出散点图;(2)求y与x之间的回归方程,对于基本苗数56.7预报有效穗;(3)计算各组残差,并计算残差平方和;(4)求R2,并说明残差变量对有效穗的影响占百分之几?尝试解答(1)散点图如下(2)由(1)中散点图看出,样本点大致分布在一条直线的附近,有比较好的线性相关关系,因此可以用线性回归方程刻画它们之间的关系设回归方程为x.30.36,43.5,5 101.56,9 511.43.1 320.66,2921.729 6,iyi6 746.76.则0.29, 34.70.故所

9、求的回归直线方程为0.29x34.70.当x56.7时,0.2956.734.7051.143.估计成熟期有效穗为51.143.(3)由于ixi,可以算得iyii分别为10.35,20.718,30.5,42.214,51.624,残差平方和:8.43.(4)(yi)250.18,故R210.832.所以解释变量小麦基本苗数对总效应约贡献了83.2%,残差变量贡献了约183.2%16.8%.(1)利用残差分析研究两个变量间的关系时,首先要根据散点图来判断它们是否线性相关,是否可以用线性回归模型来拟合数据,然后通过残差1,2,n来判断模型拟合的效果(2)若残差点比较均匀地分布在水平带状区域中,带

10、状区域越窄,说明模型拟合度越高,回归方程预报精确度越高练一练2某运动员训练次数与运动成绩之间的数据关系如下:次数(x)3033353739444650成绩(y)3034373942464851(1)作出散点图;(2)求出线性回归方程;(3)作出残差图,并说明模型的拟合效果;(4)计算R2,并说明其含义解:(1)作出该运动员训练次数x与成绩y之间的散点图,如图所示,由散点图可知,它们之间具有线性相关关系(2)39.25,40.875,12 656,13 731,iyi13 180,1.041 5,0.003 875,线性回归方程为1.041 5x0.003 875.(3)残差分析计算得11.24

11、,20.366,30.551,40.468,51.385,60.178,70.095,81.071.作残差图如图所示,由图可知,残差点比较均匀地分布在水平带状区域中,说明选用的模型比较合适(4)计算相关指数R2计算相关指数R20.985 5,说明了该运动员成绩的差异有98.55%是由训练次数引起的.讲一讲3(链接教材P6例2)某地区六年来轻工业产品利润总额y与年次x的试验数据如下表所示:年次x123456利润总额y11.3511.8512.4413.0713.5914.41由经验知,年次x与利润总额y(单位:亿元)近似有如下关系:yabxe0.其中a,b均为正数,求y关于x的回归方程思路点拨解

12、答此题可根据散点图选择恰当的拟合函数,而本题已经给出,只需将其转化为线性函数,利用最小二乘法求得回归直线方程,再将其还原为非线性回归方程即可尝试解答对yabxe0两边取自然对数,得ln yln ae0xln b,令zln y,则z与x的数据如下表:x123456z2.432.472.522.572.612.67由zln ae0xln b及最小二乘法公式,得ln b0.047 7,ln ae02.378,即2.3780.047 7x,故10.81.05x.非线性回归问题有时并不给出经验公式这时我们可以画出已知数据的散点图,把它与学过的各种函数(幂函数、指数函数、对数函数等)图象作比较,挑选一种跟

13、这些散点拟合得最好的函数,然后采用适当的变量变换,把问题化为线性回归分析问题,使之得到解决其一般步骤为:练一练3某电容器充电后,电压达到100 V,然后开始放电,由经验知道,此后电压U随时间t变化的规律用公式UAebt(b0)表示,现测得时间t(s)时的电压U(V)如下表:t/s012345678910U/V100755540302015101055试求:电压U对时间t的回归方程(提示:对公式两边取自然对数,把问题转化为线性回归分析问题)解:对UAebt两边取对数得ln Uln Abt,令yln U,aln A,xt,则yabx,y与x的数据如下表:x012345678910y4.64.34.

14、03.73.43.02.72.32.31.61.6根据表中数据画出散点图,如图所示,从图中可以看出,y与x具有较好的线性相关关系,由表中数据求得5,3.045,由公式计算得0.313,4.61,所以y对x的线性回归方程为0.313x4.61.所以ln 0.313t4.61,即e0.313t4.61e0.313te4.61,因此电压U对时间t的回归方程为e0.313te4.61.课堂归纳感悟提升1本节课的重点是线性回归方程的求法及线性回归分析,难点是残差分析和非线性回归分析问题2本节课要重点掌握的规律方法(1)线性回归分析,见讲1;(2)残差分析,见讲2;(3)非线性回归分析,见讲3.课下能力提

15、升(一)学业水平达标练题组1线性回归分析1关于回归分析,下列说法错误的是()A在回归分析中,变量间的关系若是非确定性关系,那么因变量不能由自变量唯一确定B线性相关系数可以是正的也可以是负的C在回归分析中,如果r21或r1,说明x与y之间完全线性相关D样本相关系数r(1,1)解析:选D样本的相关系数应满足1r1.2为了研究变量x和y的线性相关性,甲、乙两人分别利用线性回归方法得到回归直线l1和l2,已知两人计算过程中,分别相同,则下列说法正确的是()Al1与l2一定平行Bl1与l2重合Cl1与l2相交于点(,)D无法判断l1和l2是否相交解析:选C回归直线一定过样本点的中心(,),故C正确3若某

16、地财政收入x与支出y满足回归方程xei(单位:亿元)(i1,2,),其中0.8,2,|ei|0.5,如果今年该地区财政收入10亿元,年支出预计不会超过()A10亿元 B9亿元C10.5亿元 D9.5亿元解析:选C0.8102ei10ei,|ei|0.5,9.5b,a B.b,aC.a D.b,a,故选C.5某种商品的广告费支出x与销售额y之间有如下关系:(单位:万元)x24568y3040605070y与x的线性回归方程为6.5x17.5,当广告费支出5万元时,残差为_解析:当广告费x5时,6.5517.550,残差为605010.答案:106在研究气温和热茶销售杯数的关系时,若求得相关指数R

17、20.85,则表明气温解释了_的热茶销售杯数变化,而随机误差贡献了剩余的_,所以气温对热茶销售杯数的效应比随机误差的效应大得多解析:由相关指数R2的意义可知,R20.85表明气温解释了85%,而随机误差贡献了剩余的15%.答案:85%15%7从某居民区随机抽取10个家庭,获得第i个家庭的月收入xi(单位:千元)与月储蓄yi(单位:千元)的数据资料,算得i80,i20,iyi184,720.(1)求家庭的月储蓄y关于月收入x的线性回归方程x;(2)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄解:(1)由题意知n10,i808,i202,所以0.3,20.380.4,故所求线性回归方程为0.3x0.4.(2)将x7代入回归方程,可以预测家庭的月储蓄约为0.370.41.7(千元)

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 高考资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁