《第五章回归分析.pptx》由会员分享,可在线阅读,更多相关《第五章回归分析.pptx(65页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、会计学1第五章第五章 回归回归(hugu)分析分析第一页,共65页。(1)函数)函数(hnsh)关系关系l反映(fnyng)客观事物之间存在着严格的依存关系。l在这种关系中,对于某一变量的每一个数 l 值,都有另一变量的确定的值与之对应。l这种关系,可以用一个数学表达式反映(fnyng)。l如:第1页/共65页第二页,共65页。(2)相关)相关(xinggun)关关系系l反映客观事物之间非严格、不确定(qudng)的线性依存关系。l一个变量发生数量变化,要影响另一变量相应变化l给定一个变量一个数值,另一变量有多个数值与之对应。l如:月收入与月支出第2页/共65页第三页,共65页。2、回归、回归
2、(hugu)分析与相关分析与相关分析分析第3页/共65页第四页,共65页。3名毕业生月收入名毕业生月收入(shur)与月支出表(元)与月支出表(元)月收入月收入 X 月支出月支出 Y小王小王 小李小李小刘小刘18001500165018002000160018001910220017001900207024001800200022302600189021002400第4页/共65页第五页,共65页。(1)相关分析)相关分析根据统计数据,求出经济现象根据统计数据,求出经济现象之间的联系程度,可以用相关之间的联系程度,可以用相关系系(gun x)数定量表示,数定量表示,如月收入与月支出。如月收入与
3、月支出。但变量之间的相关关系但变量之间的相关关系(gun x)并不能一一对应表达。并不能一一对应表达。第5页/共65页第六页,共65页。第6页/共65页第七页,共65页。3名毕业生月收入名毕业生月收入(shur)与月支出表(元)与月支出表(元)月收入月收入 X 月支出月支出 Y小王小王 小李小李小刘小刘18001500165018002000160018001910220017001900207024001800200022302600189021002400月支出均值月支出均值 E(Y)16501770189020102130第7页/共65页第八页,共65页。(2)回归分析)回归分析根据统计
4、资料求出变量之间在数量变化方面根据统计资料求出变量之间在数量变化方面 的统计规律,可以用回归方程表示。的统计规律,可以用回归方程表示。变量之间的回归关系变量之间的回归关系(gun x)可以一一对应可以一一对应表达。表达。第8页/共65页第九页,共65页。回归回归(hugu)(hugu)函数函数平均平均(pngjn)(pngjn)支出支出第9页/共65页第十页,共65页。3、回归模型、回归模型(mxng)的种类的种类第10页/共65页第十一页,共65页。一元回一元回归归(简单回归)(简单回归)多元回多元回归归(复回归复回归)线性回线性回归归非线性回非线性回归归一一 元元线线性性回回归归按自变量的
5、按自变量的 个数个数按回归的按回归的 形态形态回归回归回归回归(hugu)(hugu)模模模模型的种类型的种类型的种类型的种类第11页/共65页第十二页,共65页。对于经判断具有线性关系的两个变量对于经判断具有线性关系的两个变量y y与与x x,构造一元线性回归模型为:,构造一元线性回归模型为:第二节第二节 一元线性回归一元线性回归(hugu)模型模型一、一元线性回归一、一元线性回归(hugu)模型模型基本式基本式第12页/共65页第十三页,共65页。第13页/共65页第十四页,共65页。第14页/共65页第十五页,共65页。3名毕业生月收入名毕业生月收入(shur)与月支出表(元)与月支出表
6、(元)月收入月收入 X 月支出月支出 Y小王小王 小李小李小刘小刘18001500165018002000160018001910220017001900207024001800200022302600189021002400月支出均值月支出均值 E(Y)16501770189020102130第15页/共65页第十六页,共65页。总体总体(zngt)(zngt)回回归方程归方程平均平均(pngjn)(pngjn)支支出出第16页/共65页第十七页,共65页。第17页/共65页第十八页,共65页。第18页/共65页第十九页,共65页。二、参数估计的主要方法二、参数估计的主要方法 -普通普通(p
7、tng)最小二乘法最小二乘法(OLS)线性回归:找到一条合适的样线性回归:找到一条合适的样本回归直线本回归直线(zhxin)来拟合样本观察值来拟合样本观察值的走势。的走势。第19页/共65页第二十页,共65页。普通普通(ptng)最小二乘法最小二乘法(Ordinary-least-square)样本样本(yngbn)(yngbn)回回归线归线 第20页/共65页第二十一页,共65页。第21页/共65页第二十二页,共65页。第22页/共65页第二十三页,共65页。第23页/共65页第二十四页,共65页。第24页/共65页第二十五页,共65页。学生身高x体重yx2y2xy估计值yc残差y-ycAB
8、CDEFGHIJ1581601621641661681701721741764750485562605261706524964256002624426896275562822428900295843027630976220925002304302538443600270437214900422574268000777690201029210080884010492121801144047.29149.44851.60653.76455.92158.07960.23662.39464.55266.709-0.2910.552-3.6061.2366.0791.921-8.236-1.3945.4
9、48-1.70916705702792203303295546-0第25页/共65页第二十六页,共65页。n案例分析一案例分析一n某国货币某国货币(hub)(hub)供应量与供应量与国民收入历史数国民收入历史数据表据表第26页/共65页第二十七页,共65页。年份货币供应量 x国民收入y199320501994255519953260199633701997367219984077199942842000469020014897200250100200352112200456117合计 480 98441971 20588 85936万万亿亿元元第27页/共65页第二十八页,共65页。确定函数方
10、程确定函数方程(fngchng)形式形式第28页/共65页第二十九页,共65页。求模型求模型(mxng)方程方程第29页/共65页第三十页,共65页。案例案例(n l)分分析二析二第30页/共65页第三十一页,共65页。地区人均支出人均支出 人均可支配收入人均可支配收入地区 人均支出人均支出人均可支配收人均可支配收入入北 京11123.8413882.62湖 北5963.257321.98天 津7867.5310312.91湖 南6082.627674.20河 北5439.777239.06广 东9636.2712380.43山 西5105.387005.03广 西5763.507785.04
11、内蒙古5419.147012.90海 南5502.437259.25辽 宁6077.927240.58重 庆7118.068093.67吉 林5492.107005.17四 川5759.217041.87黑龙江5015.196678.90贵 州4948.986569.23上 海11040.3414867.49云 南6023.567643.57浙 江9712.8913179.53陕 西5666.546806.35安 徽5064.346778.03甘 肃5298.916657.24福 建7356.269999.54青 海5400.246745.32江 西4914.556901.42宁 夏5330.
12、346530.48山 东6069.358399.91新 疆5540.617173.54江 苏 6708.589262.46 西 藏 8045.34 8765.45 河 南4941.606926.12第31页/共65页第三十二页,共65页。1、建立计量模型、建立计量模型由经济理论知,消费支出受可支由经济理论知,消费支出受可支配收入的影响配收入的影响(yngxing),两,两者之间具有正向同步变化的趋者之间具有正向同步变化的趋势。势。除可支配收入之外,对消费支出除可支配收入之外,对消费支出有影响有影响(yngxing)的其他因素的其他因素均包含在随机误差项中。均包含在随机误差项中。模型中,解释变量
13、为年人均可支模型中,解释变量为年人均可支配收入配收入X,被解释变量为年人,被解释变量为年人均消费支出均消费支出Y。第32页/共65页第三十三页,共65页。模型形式可根据凯恩斯的边际消费倾向理论建立一元模型形式可根据凯恩斯的边际消费倾向理论建立一元模型形式可根据凯恩斯的边际消费倾向理论建立一元模型形式可根据凯恩斯的边际消费倾向理论建立一元线形回归模型,也可通过散点图来选择线形回归模型,也可通过散点图来选择线形回归模型,也可通过散点图来选择线形回归模型,也可通过散点图来选择(xu(xu nz)nz)合适合适合适合适的模型的模型的模型的模型形式。两变量的散点图如下:形式。两变量的散点图如下:形式。两
14、变量的散点图如下:形式。两变量的散点图如下:第33页/共65页第三十四页,共65页。得回归方程如下得回归方程如下得回归方程如下得回归方程如下(rxi)(rxi):2、估计、估计(gj)参参数数 (0.86)(23.27)R2=0.9491 F=541.26括号中对应(duyng)的是估计参数对应(duyng)的t统计量的值。第34页/共65页第三十五页,共65页。三、回归方程的显著性检验三、回归方程的显著性检验三、回归方程的显著性检验三、回归方程的显著性检验(ji(ji nyn)nyn)建立的一元线性回归模型,存在以下疑问建立的一元线性回归模型,存在以下疑问建立的一元线性回归模型,存在以下疑问
15、建立的一元线性回归模型,存在以下疑问(1 1)是否符合)是否符合)是否符合)是否符合(fh)(fh)变量之间的客观规律?变量之间的客观规律?变量之间的客观规律?变量之间的客观规律?(2 2)两变量之间是否具有显著的线性关系?)两变量之间是否具有显著的线性关系?)两变量之间是否具有显著的线性关系?)两变量之间是否具有显著的线性关系?第35页/共65页第三十六页,共65页。(一)线性相关(一)线性相关(一)线性相关(一)线性相关(xinggun)(xinggun)系数检验系数检验系数检验系数检验在统计研究中,对现象间相关在统计研究中,对现象间相关在统计研究中,对现象间相关在统计研究中,对现象间相关
16、(xinggun)(xinggun)关系的密切关系的密切关系的密切关系的密切程度可用统计指标来测定,用相关程度可用统计指标来测定,用相关程度可用统计指标来测定,用相关程度可用统计指标来测定,用相关(xinggun)(xinggun)系数系数系数系数r r来确定。来确定。来确定。来确定。第36页/共65页第三十七页,共65页。相关系数检验法相关系数检验法相关系数检验法相关系数检验法 第一步,计算相关系数第一步,计算相关系数第一步,计算相关系数第一步,计算相关系数R R;第二步,根据回归第二步,根据回归第二步,根据回归第二步,根据回归(hugu)(hugu)模型的自由度(模型的自由度(模型的自由度
17、(模型的自由度(n-2n-2)和给定的)和给定的)和给定的)和给定的显著性水平值显著性水平值显著性水平值显著性水平值,从相关系数临界值表中查出临界值;,从相关系数临界值表中查出临界值;,从相关系数临界值表中查出临界值;,从相关系数临界值表中查出临界值;第三步,判别。若第三步,判别。若第三步,判别。若第三步,判别。若|R|R(n-2)|R|R(n-2),表明两变量之间线性相关,表明两变量之间线性相关,表明两变量之间线性相关,表明两变量之间线性相关关系显著,检验通过,这时回归关系显著,检验通过,这时回归关系显著,检验通过,这时回归关系显著,检验通过,这时回归(hugu)(hugu)模型可以用来预测
18、;若模型可以用来预测;若模型可以用来预测;若模型可以用来预测;若|R|R|R|0 r0 为正相关,为正相关,为正相关,为正相关,r 0 r 0 为负相关为负相关为负相关为负相关l l|r|=0|r|=0 表示不存在线性关系,但可能表示不存在线性关系,但可能表示不存在线性关系,但可能表示不存在线性关系,但可能(knng)(knng)存在非线存在非线存在非线存在非线性关系性关系性关系性关系l l|r|r|1 1 表示完全线性相关表示完全线性相关表示完全线性相关表示完全线性相关l l r=1:r=1:完全正相关;完全正相关;完全正相关;完全正相关;l l r=-1 r=-1:完全负相关:完全负相关:
19、完全负相关:完全负相关l l|r|0.7|r|0.7为高度相关为高度相关为高度相关为高度相关l l0.3|r|0.70.3|r|0.7为中度相关为中度相关为中度相关为中度相关l l0|r|0.30|r|0.3为低度相关为低度相关为低度相关为低度相关第41页/共65页第四十二页,共65页。例例序号序号收入(千元)收入(千元)x支出(千元)支出(千元)y1234567811.5222.5344.60.81.52.11.82.42.83.94.712.25446.2591621.160.642.254.413.245.767.8415.2122.090.82.254.23.668.415.621.6
20、2合计合计20.62063.6661.4462.47求收入求收入(shur)与支出之间的关与支出之间的关系。系。第42页/共65页第四十三页,共65页。求人均求人均(rn jn)销售额与利润率之间的相关销售额与利润率之间的相关关系关系?例例第43页/共65页第四十四页,共65页。解:解:解:解:两者之间存在高度两者之间存在高度(god)的正相关关的正相关关系系第44页/共65页第四十五页,共65页。(二)可决系数(二)可决系数(xsh)(xsh)检验检验n n建立建立建立建立(jinl)(jinl)了回归方程以后,通常要用方程估计了回归方程以后,通常要用方程估计了回归方程以后,通常要用方程估计
21、了回归方程以后,通常要用方程估计值值值值YcYc来推断或预测实际值来推断或预测实际值来推断或预测实际值来推断或预测实际值Y Y。n n判断用判断用判断用判断用YcYc(回归估计值)去估计(回归估计值)去估计(回归估计值)去估计(回归估计值)去估计Y Y(实际值)是否(实际值)是否(实际值)是否(实际值)是否准确可靠?也即回归直线与各实际点的拟合效果如准确可靠?也即回归直线与各实际点的拟合效果如准确可靠?也即回归直线与各实际点的拟合效果如准确可靠?也即回归直线与各实际点的拟合效果如何?何?何?何?n n -可决系数分析可决系数分析可决系数分析可决系数分析第45页/共65页第四十六页,共65页。总
22、离差平方和总离差平方和残差平方和残差平方和回归回归(hugu)(hugu)平方和平方和第46页/共65页第四十七页,共65页。(1)回归方程的方差分析及证明)回归方程的方差分析及证明(zhngmng)第47页/共65页第四十八页,共65页。SST(Sum of squares of total)总离差平方和总离差平方和 SSR(Sum of squares of regression)回归回归(hugu)平方和平方和 SSE(Sum of squares of errors)残差平方和残差平方和第48页/共65页第四十九页,共65页。(2)可决系数)可决系数(xsh)计算计算n n判定系数是指
23、因变量的总变差中可以判定系数是指因变量的总变差中可以判定系数是指因变量的总变差中可以判定系数是指因变量的总变差中可以(ky(ky)被自变量被自变量被自变量被自变量解释部分的比例,是衡量拟合模型优劣的重要分析指解释部分的比例,是衡量拟合模型优劣的重要分析指解释部分的比例,是衡量拟合模型优劣的重要分析指解释部分的比例,是衡量拟合模型优劣的重要分析指标。标。标。标。第49页/共65页第五十页,共65页。可决系数可决系数(xsh)的表示:的表示:越大,说明越大,说明X与与Y之间的关系越紧密,之间的关系越紧密,回归直线的代表性(拟合回归直线的代表性(拟合(n h)效果)就越好。效果)就越好。第50页/共
24、65页第五十一页,共65页。(三)估计(三)估计(三)估计(三)估计(gj)(gj)标准误差检标准误差检标准误差检标准误差检验验验验是指因变量各实际值与其估计值之间的平是指因变量各实际值与其估计值之间的平均差异程度,是总体误差均差异程度,是总体误差(wch)项项 的的方差方差 的估计量,用符号的估计量,用符号 表示。表示。表明其估计值对各实际表明其估计值对各实际(shj)值代表性的强弱;其值值代表性的强弱;其值越小,回归方程的代表性越强,用回归方程估计或预测越小,回归方程的代表性越强,用回归方程估计或预测的结果越准确。的结果越准确。第51页/共65页第五十二页,共65页。计算公式计算公式(仅作
25、参考)在大样本(仅作参考)在大样本(仅作参考)在大样本(仅作参考)在大样本(yngbn)(yngbn)条件下,可用公式条件下,可用公式条件下,可用公式条件下,可用公式计算:计算:计算:计算:实际实际(shj)运算时,运算时,用此公式:用此公式:第52页/共65页第五十三页,共65页。l估计标准差估计标准差()越小,则变量越小,则变量(binling)间相关程度间相关程度()越高,回归越高,回归线对线对Y的解释程度越高。的解释程度越高。判定系数判定系数(xsh)与估计标准差与估计标准差的关系的关系第53页/共65页第五十四页,共65页。例题例题(lt)求估计标准差与判定求估计标准差与判定(pnd
26、ng)系数。系数。第54页/共65页第五十五页,共65页。解解第55页/共65页第五十六页,共65页。了解了解了解了解(li(li oji)oji)自学自学自学自学(四)其他(qt)检验第56页/共65页第五十七页,共65页。第57页/共65页第五十八页,共65页。估计估计(gj)的前提:回归方程经过检验,的前提:回归方程经过检验,证明证明 X 和和 Y 的关系在统计上是显著相关的。的关系在统计上是显著相关的。对于对于(duy)(duy)给定的给定的 X X 值,求出值,求出 Y Y 的的一个估计值。一个估计值。对于对于(duy)(duy)给定的给定的 X X 值,求出值,求出Y Y 的置的置
27、信区间。信区间。四、回归方程的估计与预测四、回归方程的估计与预测点估计点估计区间估计区间估计第58页/共65页第五十九页,共65页。点估计点估计点估计点估计若若 x=800(万吨),则:(万吨),则:第59页/共65页第六十页,共65页。区间区间区间区间(q jin)(q jin)估计估计估计估计对于对于(duy)给定的给定的 x=x0,Y 的的t置信区间置信区间为:为:自由度为自由度为n-2的的 t 分布分布的的双侧分位数双侧分位数第60页/共65页第六十一页,共65页。在大样本在大样本(yngbn)条件下,条件下,近似有:近似有:第61页/共65页第六十二页,共65页。学生身高体重估计值A
28、BCDEFGHIJ1581601621641661681701721741764750485562605261706524964256002624426896275562822428900295843027630976220925002304302538443600270437214900422574268000777690201029210080884010492121801144047.2949.4551.6153.7655.9258.0860.2462.3964.5566.71-9.71-7.55-5.39-3.24-1.081.083.245.397.559.71-10-7-9-253-5413816705702792203303295546-00若令概率若令概率(gil)度为度为99.73,则有,则有 t3第62页/共65页第六十三页,共65页。第63页/共65页第六十四页,共65页。本章本章(bn zhn)重点重点掌握OLS法的运用掌握相关系数的计算(j sun)掌握t检验的运用掌握区间预测的运用第64页/共65页第六十五页,共65页。