31回归分析的基本思想及其初步应用(一).ppt

上传人:仙*** 文档编号:22965070 上传时间:2022-06-27 格式:PPT 页数:27 大小:908.01KB
返回 下载 相关 举报
31回归分析的基本思想及其初步应用(一).ppt_第1页
第1页 / 共27页
31回归分析的基本思想及其初步应用(一).ppt_第2页
第2页 / 共27页
点击查看更多>>
资源描述

《31回归分析的基本思想及其初步应用(一).ppt》由会员分享,可在线阅读,更多相关《31回归分析的基本思想及其初步应用(一).ppt(27页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、2022-6-27郑平正 制作3.1回归分析的基回归分析的基本思想及其初步本思想及其初步应用(一)应用(一)高二数学高二数学 选修选修2-3数学数学统计内容统计内容1. 画散点图画散点图2. 了解最小二乘法的思想了解最小二乘法的思想3. 求回归直线方程求回归直线方程 ybxa4. 用回归直线方程解决应用问题用回归直线方程解决应用问题2022-6-27问题问题1:正方形的面积:正方形的面积y与正方形的边长与正方形的边长x之间之间 的的函数关系函数关系是是y = x2确定性关系确定性关系问题问题2:某水田水稻产量:某水田水稻产量y与施肥量与施肥量x之间是否之间是否 有一个确定性的关系?有一个确定性

2、的关系?例如:在例如:在 7 块并排、形状大小相同的试验田上块并排、形状大小相同的试验田上 进行施肥量对水稻产量影响的试验,得进行施肥量对水稻产量影响的试验,得 到如下所示的一组数据:到如下所示的一组数据:施化肥量施化肥量x 15 20 25 30 35 40 45水稻产量水稻产量y 330 345 365 405 445 450 455复习复习 变量之间的两种关系变量之间的两种关系10 20 30 40 50500450400350300施化肥量施化肥量x 15 20 25 30 35 40 45水稻产量水稻产量y 330 345 365 405 445 450 455xy施化肥量施化肥量水

3、稻产量水稻产量 自变量取值一定时,因变量的取值带有一定自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做随机性的两个变量之间的关系叫做相关关系相关关系。1、定义、定义: 1):相关关系是一种不确定性关系;):相关关系是一种不确定性关系;注注对具有相关关系的两个变量进行统计对具有相关关系的两个变量进行统计分析的方法叫分析的方法叫回归分析回归分析。2):): 现实生活中存在着大量的相关关系。现实生活中存在着大量的相关关系。探索:水稻产量探索:水稻产量y与施肥量与施肥量x之间大致有何规之间大致有何规律?律?2022-6-2710 20 30 40 50500450400350300

4、发现:图中各点,大致分布在某条直线附近。发现:图中各点,大致分布在某条直线附近。探索探索2:在这些点附近可画直线不止一条,哪条直:在这些点附近可画直线不止一条,哪条直线最能代表线最能代表x与与y之间的关系呢?之间的关系呢?施化肥量施化肥量x 15 20 25 30 35 40 45水稻产量水稻产量y 330 345 365 405 445 450 455xy散点图散点图施化肥量施化肥量水稻产量水稻产量2022-6-2710 20 30 40 50500450400350300 xy施化肥量施化肥量水稻产量水稻产量yx探究探究对于一组具有线性相关关系的数据对于一组具有线性相关关系的数据1122(

5、 ,),(,),.,(,),nnx yxyxy我们知道其回归方程的截距和斜率的最小二乘估计公式分别为:我们知道其回归方程的截距和斜率的最小二乘估计公式分别为:1122211()(),.(2)()nniiiiiinniiiixxyyxnxybxxxnxy,.(1)aybx1111,.nniiiixx yynn其中( , )x y称为样本点的中心。称为样本点的中心。你能推导出这个公式吗?你能推导出这个公式吗?1122( ,),(,),.,(,)nnx yxyxy假设我们已经得到两个具有相关关系的变量的一组数据假设我们已经得到两个具有相关关系的变量的一组数据 且回归方程是:且回归方程是:y=bx+a

6、,(1,2,., )ix in()iiiiyyybxa其中,其中,a,b是待定参数。当变量是待定参数。当变量x取取 时时 它与实际收集到的它与实际收集到的 之间的偏差是之间的偏差是iyoxy11( ,)x y22(,)xy( ,)iix yiiyy易知,截距易知,截距 和斜率和斜率 分别是使分别是使取最小值时取最小值时 的值。由于的值。由于( ,)()iiiiQyyyx ab, 21( ,)()()niiiQyxyxyx 221()2() () () niiiiiyxyxyxyxyxyx2211()2() ()() ,nniiiiiiyxyxyxyxyxn yx11() ()()()nniii

7、iiiyxyxyxyxyxyx注意到,11()()nniiiiyxyxn yx()()0,yxnyn xn yx221( ,)()()niiiQyxyxn yx 因此,2222111()2()()()()nnniiiiiiixxxxyyyyn yx2222211221111()()()()()()()()()nniiiinniiiinniiiiiixxyyxxyyn yxxxyyxxxx121()()()niiiniixxyyxxyx这正是我们所要推导的公式。这正是我们所要推导的公式。在上式中,后两项和在上式中,后两项和 无关,而前两项为非负无关,而前两项为非负数,因此要使数,因此要使Q取得最

8、小值,当且仅当前两项的值取得最小值,当且仅当前两项的值均为均为0,即有,即有, 1、所求直线方程叫做、所求直线方程叫做回归直线方程回归直线方程; 相应的直线叫做相应的直线叫做回归直线回归直线。2、对两个变量进行的线性分析叫做、对两个变量进行的线性分析叫做线性回归分析线性回归分析。1122211()(),()nniiiiiinniiiixx yyxnxybxxxnxay bxy 1、回归直线方程、回归直线方程nn(x- x )(y- y )xy-n x yiiiii= 1i= 1b =,nn222(x- x )x-n xiii= 1i= 1 a = y -b x .nn11x =x,y =y.i

9、inni= 1i= 1其其 中中最小二乘法:最小二乘法:ybxa( , )x y称为样本点的中心称为样本点的中心。2、求回归直线方程的步骤:、求回归直线方程的步骤:1111(1),nniiiixxyynn求211(2),.nniiiiixx y求(3)代入公式)代入公式1122211()(),(),.(1)nniiiiiinniiiixx yyxnxybxxxnxa y bxy (4)写出直线方程为)写出直线方程为y=bx+a,即为所求的回归直线方程。即为所求的回归直线方程。2022-6-27例例1 1、观察两相关量得如下数据、观察两相关量得如下数据: :x-1-2-3-4-553421y-9

10、-7-5-3-115379101010221110,0,110,3 01 0.3 ,1iiiiiiixyyyxx求两变量间的回归方程求两变量间的回归方程. .解:列表:解:列表:i12345678910 xi-1-2-3-4-553421yi-9-7-5-3-115379xiyi91415125515121491011022110110100111010010iiiiixybyxxx000aybxb.yx所求回归直线方程为所求回归直线方程为例例2:已知:已知10只狗的血球体积及血球的测量值如下:只狗的血球体积及血球的测量值如下:x45424648423558403950y6.53 6.30 9

11、.52 7.506.995.90 9.49 9.20 6.55 8.72x(血球体积血球体积,mm), y(血球数,百万血球数,百万)(1)画出上表的散点图;)画出上表的散点图;(2)求出回归直线并且画出图形;)求出回归直线并且画出图形;(3)回归直线必经过的一点是哪一点?)回归直线必经过的一点是哪一点?2022-6-273 3、利用回归直线方程对总体进行线性相关性的检验、利用回归直线方程对总体进行线性相关性的检验 例例3 3、炼钢是一个氧化降碳的过程,钢水含碳量的多少、炼钢是一个氧化降碳的过程,钢水含碳量的多少直接影响冶炼时间的长短,必须掌握直接影响冶炼时间的长短,必须掌握钢水含碳量和冶炼钢

12、水含碳量和冶炼时间的关系。如果已测得炉料熔化完毕时,钢水的含碳时间的关系。如果已测得炉料熔化完毕时,钢水的含碳量量x与冶炼时间与冶炼时间y(从炉料熔化完毕到出刚的时间)的一(从炉料熔化完毕到出刚的时间)的一列数据,如下表所示:列数据,如下表所示:x(0.01%)104180190177147134150191204121y(min)100200210185155135170205235125(1 1)y y与与x x是否具有线性相关关系;是否具有线性相关关系;(2 2)如果具有线性相关关系,求回归直线方程;)如果具有线性相关关系,求回归直线方程;(3 3)预测当钢水含碳量为)预测当钢水含碳量为

13、160160个个0.01%0.01%时,应冶炼多少分时,应冶炼多少分钟?钟?2022-6-27(1)(1)列出下表列出下表, ,并计算并计算i12345678910 xi104180190177147134150191204121yi100200210185155135170205235125xiyi1040036000399003274522785180902550039155479401512510101022111159.8,172,265448,312350,287640iiiiiiixyyyxx1011010222211100.9906.(10)(10)iiiiiiix yx yrx

14、xyy于是,10110221101.26710iiiiixybyxxx30.51.aybx 所以回归直线的方程为所以回归直线的方程为 =1.267x-30.51 y(3)(3)当当x=160 x=160时时, 1.267.160-30.51=172, 1.267.160-30.51=172 y(2)设所求的回归方程为设所求的回归方程为ybxa例题例题4 4 从某大学中随机选出从某大学中随机选出8 8名女大学生,其身名女大学生,其身高和体重数据如下表:高和体重数据如下表:编号12345678身高165165157170175165155170体重4857505464614359求根据一名女大学生

15、的身高预报她的体重的求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为回归方程,并预报一名身高为172172的女的女大学生的体重。大学生的体重。172.85849. 0 xy分析:由于问题中分析:由于问题中要求根据身高预报要求根据身高预报体重,因此选取身体重,因此选取身高为自变量,体重高为自变量,体重为因变量为因变量学学身身高高172cm女172cm女大大生生体体重重y = 0.849y = 0.849172-85.712 = 60.316(kg)172-85.712 = 60.316(kg)2.2.回归方程:回归方程:1. 散点图;散点图;n(x -x)(y -y)iii=1r

16、=nn22(x -x)(y -y)iii=1i=1相关系数相关系数正相关;负相关通常,正相关;负相关通常,r0.75,认为两个变量有很强的相关性,认为两个变量有很强的相关性本例中本例中,由上面公式由上面公式r=0.7980.75探究?探究?身高为身高为172172的女大学生的体重一定的女大学生的体重一定是是60.316kg60.316kg吗?如果不是吗?如果不是, ,其原因是什其原因是什么么? ?如何描述两个变量之间线性相关关系的强弱?如何描述两个变量之间线性相关关系的强弱? 在在数学数学3中,我们学习了用相关系数中,我们学习了用相关系数r来衡量两个变量来衡量两个变量之间线性相关关系的方法。之间线性相关关系的方法。相关系数相关系数r12211()().()()niiinniiiixxyyxxyy0.751, 1, 0.75, 0 25,0.25,rrr 当, 表明两个变量正相关很强;当表明两个变量负相关很强;当.表明两个变量相关性较弱。相关关系的测度相关关系的测度(相关系数取值及其意义)

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 小学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁