《数学ch相关与回归分析学习教案.pptx》由会员分享,可在线阅读,更多相关《数学ch相关与回归分析学习教案.pptx(96页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、会计学1数学数学ch相关与回归相关与回归(hugu)分析分析第一页,共96页。第一节第一节 变量间的相关变量间的相关(xinggun)关系关系 一、相关关系的概念一、相关关系的概念一、相关关系的概念一、相关关系的概念 相关关系是指客观现象间确实存在相关关系是指客观现象间确实存在相关关系是指客观现象间确实存在相关关系是指客观现象间确实存在(cnzi)(cnzi)(cnzi)(cnzi)的数量上不的数量上不的数量上不的数量上不是严格对应的依存关系。是严格对应的依存关系。是严格对应的依存关系。是严格对应的依存关系。变量之间关系变量之间关系变量之间关系变量之间关系函数关系函数关系函数关系函数关系相关关
2、系相关关系相关关系相关关系因果关系因果关系因果关系因果关系互为因果关系互为因果关系互为因果关系互为因果关系共变关系共变关系共变关系共变关系确定性依存关系确定性依存关系确定性依存关系确定性依存关系随机性随机性随机性随机性依存关依存关依存关依存关系系系系第1页/共96页第二页,共96页。x xy y函数函数函数函数(hnsh)(hnsh)关系关系关系关系x xy y相关相关相关相关(xinggun)(xinggun)关系关系关系关系第2页/共96页第三页,共96页。按涉及变量按涉及变量(binling)的多少分为的多少分为按照表现形式不同按照表现形式不同(b tn)分为分为按照按照(nzho)变化
3、方向不同分为变化方向不同分为一元相关(单相关)一元相关(单相关)多元相关(复相关)多元相关(复相关)直线相关(线性相关)直线相关(线性相关)曲线相关(非线性相关)曲线相关(非线性相关)负相关负相关正相关正相关二、相关关系的类型二、相关关系的类型二、相关关系的类型二、相关关系的类型第3页/共96页第四页,共96页。三相关分析三相关分析三相关分析三相关分析(fnx)(fnx)(fnx)(fnx)的基本内的基本内的基本内的基本内容容容容n1、判断现象之间是否存在相关关系(gun x)、关系(gun x)的类型及密切程度;n、为相关关系(gun x)建立回归方程或经验公式;n、测定估计误差。第4页/共
4、96页第五页,共96页。第二节第二节第二节第二节 相关相关相关相关(xinggun)(xinggun)图(散点图)和相关图(散点图)和相关图(散点图)和相关图(散点图)和相关(xinggun)(xinggun)系数系数系数系数xy正正 相相 关关xy负负 相相 关关xy曲线相关曲线相关xy不不 相相 关关一、相关一、相关(xinggun)图图 相关关系的判断相关关系的判断相关关系的判断相关关系的判断(pndun)(pndun)方法方法方法方法第5页/共96页第六页,共96页。二、相关二、相关二、相关二、相关(xinggun)(xinggun)(xinggun)(xinggun)表表表表1 1
5、1 1、简单相关、简单相关、简单相关、简单相关(xinggun)(xinggun)(xinggun)(xinggun)表表表表序号序号亩施肥量(公斤)亩施肥量(公斤)亩产量(公斤)亩产量(公斤)1 155552962962 250503253253 365653193194 470703743745 574743873876 679794064067 780803893898 882824344349 98484497497101085855285281111868651151112129090535535小麦小麦(xiomi)亩产量与施肥量相关表亩产量与施肥量相关表第6页/共96页第七页,共
6、96页。2 2、分组相关、分组相关(xinggun)(xinggun)表表 产量产量(chnling)和单位成本相关表和单位成本相关表产量(件)产量(件)企业数(个)企业数(个)平均单位成本(元)平均单位成本(元)202030309 916.816.8303040405 515.615.6404050505 515.015.0505060606 614.814.86060以上以上5 514.214.2第7页/共96页第八页,共96页。三、三、三、三、简单简单简单简单(jindn)(jindn)相关系数相关系数相关系数相关系数n概念概念n用用以以反反映映两两变变量量(binling)(binli
7、ng)间间线线性性相相关关密密切切程程度的统计指标。度的统计指标。n总体相关系数记为总体相关系数记为,样本相关系数记为,样本相关系数记为 r r。n计算公式计算公式n未分组资料未分组资料(8-5)第8页/共96页第九页,共96页。样本相关系数的定义样本相关系数的定义公式公式(gngsh)实质实质第9页/共96页第十页,共96页。8-7相关系数的推导相关系数的推导(tudo)公式公式第10页/共96页第十一页,共96页。(8-8)(8-6)第11页/共96页第十二页,共96页。相关系数相关系数r r的取值范围的取值范围(fnwi)(fnwi):-1r1-1r1r0 r0 为为正相关正相关,r 0
8、 r 0 为为负相关负相关;|r|=0|r|=0 表示不存在表示不存在线性线性线性线性关系;关系;|r|r|1 1 表示表示完全完全线性线性线性线性相关相关;0|r|10|r|10|r|10|r|tt/2/2,拒绝,拒绝H0H0,相关关系显著;,相关关系显著;若若t ttt=64.9809t/2(13-2)=2.201/2(13-2)=2.201,拒绝,拒绝H0H0,人均,人均消费金额与人均国民收入之间的相关关系显著消费金额与人均国民收入之间的相关关系显著,不能不能否认总体两变量存在线性相关。否认总体两变量存在线性相关。第23页/共96页第二十四页,共96页。第二节第二节 一元线性回归一元线性
9、回归(hugu)模型模型一一 回归分析回归分析(fnx)(fnx)的概念的概念1 1 概念概念 运用数学方法测定相关变量间的一运用数学方法测定相关变量间的一般关系的分析般关系的分析(fnx)(fnx)过程。过程。回归分析方法就是通过对占有相关资料的分析,找出其变化回归分析方法就是通过对占有相关资料的分析,找出其变化(binhu)规律性,建立适宜的数学模型或经验公式,使现象间数量上的不确定、不严格的相互依存关系变为确定性的、严格依存的函数关系,即将这种数量关系一般化、平均化。规律性,建立适宜的数学模型或经验公式,使现象间数量上的不确定、不严格的相互依存关系变为确定性的、严格依存的函数关系,即将这
10、种数量关系一般化、平均化。第24页/共96页第二十五页,共96页。2 2 回归分析与相关回归分析与相关(xinggun)(xinggun)分析的联系与分析的联系与区别区别 联联 系系 区区 别别 1、理理论论和和方方法法具具有有一一 致性;致性;2 2、无无相相关关就就无无回回归归,相相关关程程度度越越高高,回回归归越越好;好;3 3、相相关关系系数数和和回回归归系系数数方方向向一一致致,可可以以互互相相推算。推算。1 1、相关分析中,、相关分析中,x x与与y y对等,回对等,回归分析中,归分析中,x x与与y y要确定自变量和要确定自变量和因变量;因变量;2 2、相关分析中、相关分析中x
11、x,y y均为随机变量,均为随机变量,回归分析中,只有回归分析中,只有y y为随机变量为随机变量3 3、相关分析测定相关程度和方向,、相关分析测定相关程度和方向,回归分析不仅可以揭示变量回归分析不仅可以揭示变量 x x 对对变量变量 y y 的影响大小,还可以用回的影响大小,还可以用回归模型进行预测和控制。归模型进行预测和控制。第25页/共96页第二十六页,共96页。二二 一元线性回归一元线性回归(hugu)(hugu)模型模型1 1 总体一元线性回归模型的一般总体一元线性回归模型的一般(ybn)(ybn)形式形式 x对对y的线性影响而形成的线性影响而形成(xngchng)的系统部分,的系统部
12、分,反映两变量的平均变动关系,反映两变量的平均变动关系,即本质特征。即本质特征。随机误差:随机误差:各种偶然因素,观察误差和其他被忽视因素的影响。各种偶然因素,观察误差和其他被忽视因素的影响。未知参数未知参数第26页/共96页第二十七页,共96页。3 3 总体一元线性回归方程总体一元线性回归方程样本(或估计的)一元线性回归方程样本(或估计的)一元线性回归方程 截距截距斜率(回归系数)斜率(回归系数)第28页/共96页第二十九页,共96页。b表明自变量表明自变量x每变动一个单位每变动一个单位(dnwi)时,变量时,变量y的平均变动值。的平均变动值。b b与与r r的关系的关系(gun x)(gu
13、n x):r0 r0 r=0b0 b0 b=0估计的回归方程的可能形态估计的回归方程的可能形态b0b0b=0(8-24)第30页/共96页第三十一页,共96页。4 4 一元线性回归模型的确定一元线性回归模型的确定(qudng)(qudng)(用未分组资料)(用未分组资料)y y倚倚x x的回归方程的回归方程 根据实际数据根据实际数据(shj)(shj),用最小平方法,即使,用最小平方法,即使 分别对分别对a a、b b求偏导并令其为零,求得两个标准方程。求偏导并令其为零,求得两个标准方程。令令则则 解联立方程解联立方程(lin l fn chn)(lin l fn chn),得到,得到第31页
14、/共96页第三十二页,共96页。解联立方程解联立方程(lin l fn chn)(lin l fn chn),得到,得到8-148-15第32页/共96页第三十三页,共96页。x xy y(x xn n,y yn n)(x x1 1,y y1 1)(x x2 2,y y2 2)(x xi i,y yi i)e ei i=y yi i-y yi i最小二乘法最小二乘法(chngf)图示图示第33页/共96页第三十四页,共96页。5 5 回归回归(hugu)(hugu)直线的特点直线的特点(1 1)回归)回归(hugu)(hugu)直线的走向,是由回归直线的走向,是由回归(hugu)(hugu)系
15、数决定的。系数决定的。(2 2)回归)回归(hugu)(hugu)直线满足直线满足 ,即即,是一条,是一条(y tio)(y tio)最适线。最适线。(4 4)回归回归(hugu)(hugu)直线是一条平均数线。直线是一条平均数线。(3 3)回归直线一定通过点(回归直线一定通过点()第34页/共96页第三十五页,共96页。n 【例例4 4】根根据据例例1 1中中的的数数据据,配配合合人人均均(rn(rn jn)jn)消费金额消费金额n对人均对人均(rn jn)(rn jn)国民收入的回归方程国民收入的回归方程解:根据解:根据a a和和b b的求解的求解(qi ji)(qi ji)公式得公式得人
16、均消费金额对人均国民收入的回归方程为人均消费金额对人均国民收入的回归方程为y=y=54.22286 54.22286+0.52638 0.52638 x x13 第35页/共96页第三十六页,共96页。n n 第36页/共96页第三十七页,共96页。例例5 5 接接例例2 2求回归方程求回归方程测量测量序序 号号储存时间储存时间(小时)(小时)x xV VC C含量含量%y%yxyxy1 10 020200 04004000 019.7019.702 21 118181 1324324181818.1918.193 32 217174 4289289343416.6816.684 43 315
17、159 9225225454515.1715.175 54 413131616169169525213.6613.666 65 512122525144144606012.1512.157 76 611113636121121666610.6410.648 87 79 94949818163639.139.139 98 88 86464646464647.627.6210109 96 68181363654546.116.11合计合计454512912928528518531853456456第37页/共96页第三十八页,共96页。解:将以上数据解:将以上数据解:将以上数据解:将以上数据(sh
18、j)(shj)代入代入代入代入公式公式公式公式 所以水果中所以水果中所以水果中所以水果中Vc Vc 含量含量含量含量(hnling)(hnling)与储存时间关系的回归方程为:与储存时间关系的回归方程为:与储存时间关系的回归方程为:与储存时间关系的回归方程为:方程表明,水果中维生素方程表明,水果中维生素方程表明,水果中维生素方程表明,水果中维生素C C C C的含量的理论起点值的含量的理论起点值的含量的理论起点值的含量的理论起点值为为为为19.70%19.70%19.70%19.70%,当储存时间每延长,当储存时间每延长,当储存时间每延长,当储存时间每延长(ynchng)1(ynchng)1(
19、ynchng)1(ynchng)1小时,维生素小时,维生素小时,维生素小时,维生素C C C C的含的含的含的含量平均降低量平均降低量平均降低量平均降低1.51%1.51%1.51%1.51%。第38页/共96页第三十九页,共96页。工业生产用固定资产工业生产用固定资产工业生产用固定资产工业生产用固定资产 (百万元百万元百万元百万元)工业总产值工业总产值工业总产值工业总产值 (百万元百万元百万元百万元)2 2 4 4 3 3 6.5 6.5 3.2 3.2 7.5 7.5 4 4 9 9 4.8 4.8 12 12 7 7 15 15例例例例6 6 6 6:某公司下属:某公司下属:某公司下属:
20、某公司下属6 6 6 6个同类个同类个同类个同类(tngli)(tngli)(tngli)(tngli)企业的有关资料如下企业的有关资料如下企业的有关资料如下企业的有关资料如下n n要求要求要求要求:n n a.a.a.a.计算相关系数;计算相关系数;计算相关系数;计算相关系数;n n b.b.b.b.用最小平方法建立直线用最小平方法建立直线用最小平方法建立直线用最小平方法建立直线(zhxin)(zhxin)(zhxin)(zhxin)回归方程并回归方程并回归方程并回归方程并估计当工业生产用固定资产为估计当工业生产用固定资产为估计当工业生产用固定资产为估计当工业生产用固定资产为80080080
21、0800万元时万元时万元时万元时,工业总产值工业总产值工业总产值工业总产值将为多少将为多少将为多少将为多少?第39页/共96页第四十页,共96页。n n解解:n n (1)(1)n n (两者两者为高度为高度(god)(god)正相关正相关)第40页/共96页第四十一页,共96页。(2)经济含义经济含义:表明工业表明工业(gngy)(gngy)生产用固定资产每增加一百万元生产用固定资产每增加一百万元,工业工业(gngy)(gngy)总产值平均上升总产值平均上升2.23172.2317百万元百万元当当(百万元百万元)yc=0.0733+2.2317x 0.0733+2.2317x 第41页/共9
22、6页第四十二页,共96页。练习练习(linx)1第42页/共96页第四十三页,共96页。(1 1 1 1)配合直线)配合直线)配合直线)配合直线(zhxin)(zhxin)(zhxin)(zhxin)方方方方程程程程 计算计算计算计算 b,a b,a b,a b,a回归方程为:回归方程为:回归方程为:回归方程为:c cc c .答案答案(d n):第43页/共96页第四十四页,共96页。()产量每增加()产量每增加()产量每增加()产量每增加1000100010001000件时,单位成本平均件时,单位成本平均件时,单位成本平均件时,单位成本平均(pngjn)(pngjn)(pngjn)(png
23、jn)变变变变动动动动n n 因为因为b=-1.820b=-1.82tt,拒绝,拒绝H0H0;t t t t t=65.0758 t/2=2.201/2=2.201,拒绝,拒绝H0H0,表明,表明(biomng)(biomng)人均收入与人均消费之间有线性关系。人均收入与人均消费之间有线性关系。第65页/共96页第六十六页,共96页。2 2 回归回归(hugu)(hugu)模型整体的模型整体的F F检验检验 H0:R2=0;H1:R20 检验检验(jinyn)(jinyn)统计量统计量 F作出决策:若作出决策:若作出决策:若作出决策:若F F F F ,拒绝拒绝拒绝拒绝(jju)H0(jju)
24、H0;若若若若FF FF ,接受接受接受接受H0H0第68页/共96页第六十九页,共96页。第四节第四节 非线性回归非线性回归(hugu)模模型型曲线模型的判别方法:曲线模型的判别方法:理论和经验判断;理论和经验判断;观察散点图观察散点图 曲线模型曲线模型(mxng)(mxng)的确定方法:的确定方法:通常用变量代换法将曲线转换为直线。按线性模型求解参数通常用变量代换法将曲线转换为直线。按线性模型求解参数(cnsh)(cnsh),而后再变换为曲线模型。,而后再变换为曲线模型。非线性回归分析必须着重解决以下两个问题:非线性回归分析必须着重解决以下两个问题:一是如何确定非线性函数的具体形式;一是如
25、何确定非线性函数的具体形式;二是如何估计非线性函数中的参数二是如何估计非线性函数中的参数第69页/共96页第七十页,共96页。双曲线双曲线双曲线双曲线 0 0 01.1.1.1.基本形式:基本形式:基本形式:基本形式:2.2.2.2.线性化方法线性化方法线性化方法线性化方法(fngf)(fngf)(fngf)(fngf)3.3.3.3.令:,令:,令:,令:,x=1/x,x=1/x,x=1/x,x=1/x,则有则有则有则有y=a+b xy=a+b xy=a+b xy=a+b x4.4.4.4.图像图像图像图像第70页/共96页第七十一页,共96页。幂函数曲线幂函数曲线幂函数曲线幂函数曲线(qx
26、in)(qxin)1.1.1.1.基本基本基本基本(jbn)(jbn)(jbn)(jbn)形式:形式:形式:形式:2.2.2.2.线性化方法线性化方法线性化方法线性化方法3.3.3.3.两端取对数得:两端取对数得:两端取对数得:两端取对数得:lg y=lga+b lg xlg y=lga+b lg xlg y=lga+b lg xlg y=lga+b lg x4.4.4.4.令:令:令:令:y=lgyy=lgyy=lgyy=lgy,x=lg xx=lg xx=lg xx=lg x,则,则,则,则y=lgy=lgy=lgy=lg+b x+b x+b x+b x5.5.5.5.图像图像图像图像00
27、 1 1 1 1 =1=1-1-1 0 0 -1-1 =-1=-1 第71页/共96页第七十二页,共96页。1 1基本基本(jbn)(jbn)形式形式2 2 线性化方法线性化方法 指数指数(zhsh)曲线曲线3 3 图象图象(t xin)(t xin)第72页/共96页第七十三页,共96页。对数对数对数对数(du sh)(du sh)曲线曲线曲线曲线1.1.1.1.基本形式基本形式基本形式基本形式(xngsh)(xngsh)(xngsh)(xngsh):2.2.2.2.线性化方法线性化方法线性化方法线性化方法3.3.3.3.x=lnx,x=lnx,x=lnx,x=lnx,则有则有则有则有y=a
28、+b xy=a+b xy=a+b xy=a+b x4.4.4.4.图像图像图像图像 0 0 0 0 第73页/共96页第七十四页,共96页。S S S S 型曲线型曲线型曲线型曲线(qxin)(qxin)(qxin)(qxin)2.2.2.2.线性化方法线性化方法线性化方法线性化方法:将方程将方程将方程将方程(fngchng)(fngchng)(fngchng)(fngchng)两边取对数两边取对数两边取对数两边取对数1/y=a+bx1/y=a+bx1/y=a+bx1/y=a+bx3.3.3.3.令:令:令:令:y=1/yy=1/yy=1/yy=1/y,则有则有则有则有y=a+b xy=a+b
29、 xy=a+b xy=a+b x1.1.基本基本基本基本(jbn)(jbn)形式:形式:形式:形式:3.3.图像图像图像图像第74页/共96页第七十五页,共96页。n n【例例例例】一一一一种种种种商商商商品品品品的的的的需需需需求求求求量量量量与与与与其其其其(yq)(yq)(yq)(yq)价价价价格格格格有有有有一一一一定定定定的的的的关系。现关系。现关系。现关系。现n n对对对对一一一一定定定定时时时时期期期期内内内内的的的的商商商商品品品品价价价价格格格格x x x x与与与与需需需需求求求求量量量量y y y y进进进进行行行行观观观观察察察察,取取取取得得得得n n的的的的样样样样
30、本本本本数数数数据据据据如如如如下下下下表表表表。试试试试判判判判断断断断商商商商品品品品价价价价格格格格与与与与需需需需求求求求量量量量之之之之间间间间回回回回n n归函数的类型,并求需求量对价格的回归方程。归函数的类型,并求需求量对价格的回归方程。归函数的类型,并求需求量对价格的回归方程。归函数的类型,并求需求量对价格的回归方程。废品率与生产率的关系废品率与生产率的关系废品率与生产率的关系废品率与生产率的关系价格价格 (元元)x x1 12 23 34 45 56 67 78 89 91010需求量需求量(千克千克)y y5858505044443838343430302929262625
31、252424第75页/共96页第七十六页,共96页。价格价格价格价格(jig)(jig)与需求量的散点图与需求量的散点图与需求量的散点图与需求量的散点图第76页/共96页第七十七页,共96页。1.1.1.1.用双曲线模型:用双曲线模型:用双曲线模型:用双曲线模型:2.2.2.2.按线性回归按线性回归按线性回归按线性回归(hugu)(hugu)(hugu)(hugu)的方法求解的方法求解的方法求解的方法求解a a a a和和和和b b b b,得,得,得,得第77页/共96页第七十八页,共96页。价格价格价格价格(jig)(jig)与需求量的散点图与需求量的散点图与需求量的散点图与需求量的散点图
32、第78页/共96页第七十九页,共96页。n n 【例例例例】为为为为研研研研究究究究(ynji)(ynji)生生生生产产产产率率率率与与与与废废废废品品品品率率率率之之之之间间间间的关系,记录数据如下表。试拟合适当的模型。的关系,记录数据如下表。试拟合适当的模型。的关系,记录数据如下表。试拟合适当的模型。的关系,记录数据如下表。试拟合适当的模型。废品率与生产率的关系废品率与生产率的关系废品率与生产率的关系废品率与生产率的关系生产率(周生产率(周/单位单位)x1000200030003500 4000 4500 5000废品率(废品率(%)y5.26.56.88.110.210.313.0第79
33、页/共96页第八十页,共96页。生产率与废品率的散点图生产率与废品率的散点图生产率与废品率的散点图生产率与废品率的散点图第80页/共96页第八十一页,共96页。1.1.1.1.用线性模型用线性模型用线性模型用线性模型(mxng)(mxng)(mxng)(mxng):y=y=y=y=0 0 0 0 1x+1x+1x+1x+,有,有,有,有2.2.2.2.y=2.671+0.0018x y=2.671+0.0018x y=2.671+0.0018x y=2.671+0.0018x3.3.3.3.用指数模型用指数模型用指数模型用指数模型(mxng)(mxng)(mxng)(mxng):y=y=y=y
34、=x x x x ,有,有,有,有4.4.4.4.y=4.05 y=4.05 y=4.05 y=4.05(1.0002)x(1.0002)x(1.0002)x(1.0002)x5.5.5.5.比较比较比较比较6.6.6.6.直直直直线线线线的的的的残残残残差差差差平平平平方方方方和和和和5.33715.33715.33715.3371 t t ,回归系数是显著的;,回归系数是显著的;,回归系数是显著的;,回归系数是显著的;t t t t ,回归系数不显著,回归系数不显著,回归系数不显著,回归系数不显著第91页/共96页第九十二页,共96页。2 2 模型整体模型整体(zhngt)(zhngt)的的F F检验检验检验检验(jinyn)(jinyn)统计量:统计量:(k k自变量个数)自变量个数)或或 按给定按给定(i dn)(i dn)的的和自由度(和自由度(2 2)和()和(n-3n-3)查)查F F表可得到临界值表可得到临界值F作出决策:作出决策:作出决策:作出决策:若若F F ,回归方程有显著意义回归方程有显著意义;若若FF ,回归方程无显著意义回归方程无显著意义第92页/共96页第九十三页,共96页。结结 束束第95页/共96页第九十六页,共96页。