《非线性回归模型优秀PPT.ppt》由会员分享,可在线阅读,更多相关《非线性回归模型优秀PPT.ppt(45页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、非线性回归模型非线性回归模型第一页,本课件共有45页5.1 非线性回归模型总体多元线性回归方程:随机形式:其中,Y因变量,X2、X3解释变量;u随机扰动项 B1截距,表示了当X2、X3为零时Y的平均值;B2、B3偏回归系数。(5.1)(5.2)上述考虑的回归模型关于参数是线性的,关于变量也是线性的。第二页,本课件共有45页5.1 非线性回归模型参数线性、变量非线性的回归方程:参数非线性、变量线性的回归方程:非线性模型指的是关于参数或解释变量是非线性函数的模型。但是有些非线性模型通过一定的变换线性化,作为线性模型处理。(5.3)(5.5)(5.4)第三页,本课件共有45页5.1 非线性回归模型线
2、性回归模型的系数解释:问题:消费与收入之间的线性回归模型C=a+b*Y,其中回归系数b在西方经济学的含义是表示边际消费倾向。在此模型中的斜率仅仅给出了个人收入单位变动引起的消费的绝对量变化。如果我们考虑商品需求的价格弹性变化,如何建立回归模型。即研究这样的问题:价格每变化一个百分点,商品的需求量将引起多大的变化率?(5.6)第四页,本课件共有45页序号序号能源消耗量能源消耗量(十万吨)(十万吨)x工业总产值(亿元)工业总产值(亿元)yx2y2xy123456789101112131415163538404249525459626465686971727624252428323137404140
3、4750495148581225144416001764240127042916348138444096422546244761504151845776576625576784102496113691600168116002209250024012601230433648409509601176156816121998236025422560305534003381362134564408合计合计9166255508626175378875.2 双对数模型:度量弹性第五页,本课件共有45页一元线性回归分析 例题即线性回归方程为:计算结果表明,在其他条件不变时,能源消耗量每增加一个单位(十万吨)
4、,工业总产值将增加0.7961个单位(亿元)。第六页,本课件共有45页5.2 双对数模型:度量弹性将上述线性模型改变为非线性回归模型:其中Y为工业总产值,X为能源消耗量。两边取对数将(5.7)变换为下列(5.8)形式:(5.7)(5.8)为了进行估计,可将模型(5.8)写成(5.9)形式:其中B1lnA。(5.9)第七页,本课件共有45页5.2 双对数模型:度量弹性模型(5.9)称为双对数(double-log)模型或双对数线性(loglinear)模型:(5.9)(5.10)模型(5.10)不仅关于参数是线性的,而且关于解释变量X*也是线性的。第八页,本课件共有45页5.2 双对数模型:度量
5、弹性 双对数回归模型回归系数B2的经济含义表示了Y对X的弹性,即X的一个微小变动引起Y变动的百分比。如果用符号Y代表Y的一个微小变动,X代表X的一个微小变动,弹性E定义为:(5.11)如果Y代表了工业总产值,X代表了能源消耗量,E则为能源消耗的弹性系数。第九页,本课件共有45页5.2 双对数模型:度量弹性a-价格b-价格的对数图形b的斜率就是价格弹性B2的估计值,此为一常数。由于此特殊性质,双对数模型又称为不变弹性模型。XYOOlnXlnYB2第十页,本课件共有45页5.2 双对数模型:度量弹性例子 利用双对数模型拟合的能源消耗量与工业总产值之间的关系,此时的回归系数即为能源消耗弹性系数。能源
6、消耗量每增加一个百分点,工业总产值将增加1.142百分点。LOG(INDUSTRY)=0.96381.1420*LOG(ENERGY)se=(0.063412)(0.255350)t =(18.00972)(-3.774381)p=(0.000000)(0.0021)r2=0.958 F=324.3499,(0.0000000)第十一页,本课件共有45页能耗与工业增加值取对数后的散点图第十二页,本课件共有45页双对数回归模型第十三页,本课件共有45页双对数模型的假设检验LOG(INDUSTRY)=0.96381.1420*LOG(ENERGY)se=(0.063412)(0.255350)t
7、=(18.00972)(-3.774381)p=(0.000000)(0.0021)r2=0.958 F=324.3499,p=0.0000000就假设检验而言,线性模型与双对数模型并没有什么不同。在随机误差服从正态分布(均值为0,方差为2)的假设下,估计的回归系数服从正态分布。或者,如果用其无偏估计量代替2,则每个估计量服从自由度为nk的t分布,其中k为包括截距在内的参数个数。第十四页,本课件共有45页Energy与Industry的相关图与其对数相关图几乎没有差别5.3 比较线性回归和双对数回归模型第十五页,本课件共有45页5.3 比较线性回归和双对数回归模型 问题:Energy与Indu
8、stry之间究竟建立怎样的模型更为合适?是线性模型还是双对数模型?经济理论只表明它们之间是正相关的,并没给出具体的函数形式。如何选择模型?选择作图比较。图形表明具有明显的线性关系,那么就用线性模型,然后进行假设检验。若散点图是非线性的,则取双对数作散点图。但此方法不适合作多变量分析。注意不能用r2来判断是用线性模型。因为,r2度量了解释变量对因变量变化的解释程度,由于模型不同,解释的对象也不同,所以不可比较。模型选择的重点不在r2上,而在解释变量之间的相关性(即理论基础)、解释变量系数的预期符号、统计显著性以及类似弹性系数这样的度量工具。第十六页,本课件共有45页5.3 比较线性回归和双对数回
9、归模型 线性模型的斜率与弹性系数分别是:双对数模型的斜率与弹性系数分别是:第十七页,本课件共有45页5.4 多元对数线性回归模型 双变量对数线性模型可推广到多个解释变量的情形:模型中的偏斜率系数B2、B3又称为偏弹性系数。因此B2度量了X3不变条件下,Y对X2的弹性,即在X3为常量时,X2每变动1%,Y变化的百分比。由于X3的影响保持不变,所以称此弹性为偏弹性。在多元对数线性模型中,每一个偏斜率系数度量了在其他变量保持不变的条件因变量对某一个解释变量的偏弹性。(5.12)第十八页,本课件共有45页5.4 多元对数线性回归模型例子 柯布道格拉斯生产函数,在(5.12)中Y表示产出,X2表示劳动投
10、入,X3表示资本投入,它反映出劳动力和资本投入之间的关系函数。利用墨西哥19551974年实际GDP,就业和实际固定资本数据得到一个多元对数线性回归模型。(5.12)第十九页,本课件共有45页5.4 多元对数线性回归模型例子(5.13)se=(0.6062)(0.1857)(0.09343)t =(-2.73)(1.83)(9.06)p=(0.014)(0.085)(0.000)R2=0.995 F=1719.23,(0.0000000)偏斜率系数0.3397度量了产出对劳动投入的弹性,即在资本投入保持不变的条件下,劳动投入每增加一个百分点,平均产出将增加34%。类似地,在劳动投入保持不变的条
11、件下,资本投入每增加一个百分点,产出将平均增加85%。第二十页,本课件共有45页5.4 多元对数线性回归模型例子 如果将两个弹性系数相加,得到一个重要的经济参数规模报酬参数,它反映了产出对投入的比例变动。1.如果两个系数之和为1,则称规模报酬不变;2.如果两个系数之和大于1,则称规模报酬递增;3.如果两个系数之和小于1,则称规模报酬递减。第二十一页,本课件共有45页 在经济研究中经常需要关注增长率,例如GDP的年均增长率、人口增长率、消费增长率等。求人口增长率Y,考虑如下复利计算公式(货币、银行利息、人口经常使用的公式):5.5 半对数模型计算增长率模型(对数线性模型)Y0Y的初始值,Yt第t
12、期的Y值,rY的复合增长率。(5.14)第二十二页,本课件共有45页将(5.14)取对数,得:(5.14)(5.15)(5.16)(5.17)(5.17)即为半对数模型,B1和B2线性,因变量为对数形式。5.5 半对数模型计算增长率模型第二十三页,本课件共有45页19701999年美国人口增长率5.5 半对数模型计算增长率模型例子美国人口时间美国人口时间205.0521238.46616207.6612240.65117209.8963242.80418211.9094245.02119213.8545247.34220215.9736249.94821218.0357252.63922220
13、.2398255.37423222.5859258.08324225.05510260.59925227.72611263.04426229.96612265.46327232.18813268.00828234.30714270.56129236.34815273.13130第二十四页,本课件共有45页19701999年美国人口增长率5.5 半对数模型计算增长率模型例子第二十五页,本课件共有45页19701999年美国人口增长率,回归方程:ln(Usapop)=5.317+0.0098*t5.5 半对数模型计算增长率模型例子第二十六页,本课件共有45页19701999年美国人口增长率,回归方
14、程:ln(Usapop)=5.317+0.0098*t 模型解释:斜率0.0098表示,平均而言,logY(美国人口)的年增长率为0.0098,即以每年0.98%的速度增长。在半对数模型中,斜率度量了解释变量的绝对变化引起的Y的比例变动或相对变动,把此相对改变量乘以100,就得到增长率。对截距5.317的解释如下:b1lnY0的估计值5.317求反对数,得到Y0203.7716,即当t0时的人口数量,也就是1969年美国人口大约为2.04亿。5.5 半对数模型计算增长率模型例子第二十七页,本课件共有45页注意:B2=ln(1+r)b2B2的估计值ln(1+r)所以,antilog(b2)=1+
15、r r=antilog(b2)-1由此得到的r是复合增长率。而前面求得的增长率是瞬时增长率,例如0.98%。注意瞬时增长率与复合增长率之间的区别,一个是回归模型的系数B2ln(1+r)(瞬时增长率),另一个是r为复合增长率。5.5 半对数模型瞬时增长率与复合增长率第二十八页,本课件共有45页在研究增长模型时,为了计算简便,通常也考虑如下模型:Yt=B1+B2*t+ut。即Y对时间的回归,此类模型称为线性趋势模型,时间称为趋势变量。若上式斜率为正,则Y有向上趋势;若斜率为负,则Y有下降趋势。对美国人口按线性趋势模型重新进行回归,得到:Usapop201.9727+2.3284*t (5.18)t
16、=(743.2718)(152.1243)r2=0.99875.5 半对数模型线性趋势模型第二十九页,本课件共有45页 对美国人口按线性趋势模型重新进行回归,得到:Usapop201.9727+2.3284*t (5.18)回归结果表明,在样本区间内,美国人口每年以2.3284(百万)的绝对速度增长,美国人口呈上升趋势;截距表示了美国1969年的人口数量,202百万。实践中,线性趋势模型和增长模型应用的十分广泛,但相对而言,增长模型更有用些。人们通常关注的是经济变量的相对变化而不是绝对变化,比如GDP,货币M2等。5.5 半对数模型线性趋势模型第三十页,本课件共有45页 对于经济计量学精要(3
17、版)p.191192个人不同消费分项的季度数据进行分析。Y1服务支出、Y2耐用消费品、Y3非耐用消费品、X个人消费总支出。假定要求个人总消费支出X的变动对服务支出Y的影响,考虑下列模型:Yt=B1+B2*lnXt+ut (5.19)回归结果:Yt=17907.5+2431.69*lnXt (5.20)se=(228.61)(27.05)t =(-78.33)(89.89)p =(0.00)(0.00)r2=0.9975.6 线性对数模型解释变量是对数形式第三十一页,本课件共有45页 Yt=B1+B2*lnXt+ut (5.19)由于对数变化是相对变化,因而模型(5.19)的斜率系数:5.6 线
18、性对数模型解释变量是对数形式(5.21)(5.22)式(5.22)表明,Y的绝对变化量Y等于B2乘以X的相对变化量。若将后者乘以100,则式(5.22)给出了X每百分比变动引起的Y的绝对变化量。因而,若X/X每变化0.01个单位,则Y的绝对变化量为0.01。假如求得实际的B2674,那么Y绝对变化量为0.01*674=6.74。第三十二页,本课件共有45页(5.23)5.7 倒数模型 从数学表达式上看倒数模型的特征是随着X的无限增大,(1/Xi)趋于0,Y接近渐近值或极限值B1。因此当变量X无限大时,形如(5.23)的回归模型将逐渐靠近其渐近线或极值。第三十三页,本课件共有45页(5.23)5
19、.7 倒数模型经济含义a 若Y表示生产的平均成本AFC,即总固定成本除以产出,X代表产出,则根据经济理论,随着产出的不断增加,AFC将逐渐降低(因为总固定成本不变),最终接近B1产出轴。B1OYXB10B20第三十四页,本课件共有45页(5.23)5.7 倒数模型经济含义b Engel消费曲线:表明消费者在某一商品上的支出与其总收入或总消费支出的关系。若Y表示消费者在某一商品上的支出,X表示消费者的总收入,则该商品具有如下特征:(1)收入有限,临界水平为B2/B1;(2)消费有一满足线B1。B1OYXB10B20B2/B1第三十五页,本课件共有45页(5.23)5.7 倒数模型经济含义c Ph
20、illips曲线:工资变化的百分比Y与失业率X之间的关系。当失业率低于UN时,工资随失业率单位变化而上升比失业率高于UN时工资随失业率单位变化下降得更快。B1OYXB10UN第三十六页,本课件共有45页(5.24)5.8 多项式回归模型生产与成本函数 上图描述了总成本TC对产出得函数以及相应得边际成本MC及平均成本AC曲线。根据价格理论,如果边际成本曲线与平均成本曲线为U线,则模型式(5.24)中得系数有如下先验值:(1)B1、B2和B4均大于0;(2)B30;(4)B233B2*B4。OYXOYXTCMCAC产出成本成本产出第三十七页,本课件共有45页(5.25)5.9 过原点的回归模型此为
21、过原点的回归。根据式(5.25)可以证明:(5.26)(5.27)(5.28)第三十八页,本课件共有45页5.9 过原点的回归模型过原点的回归模型与带截距项的线性模型存在若干差异:1.无截距模型使用了原始的平方和以及交叉乘积,而有截距模型则使用了均值调整后的平方和与交叉项;2.现在计算2的自由度是n1,而不是n2,因为(5.25)式中只有一个参数;3.R2计算公式通常假定了模型中存在截距项,因此无截距模型不能使用这个公式;4.有截距模型的残差平方和ue总为零,但无截距模型不一定为零。5.只有在充分理论保证下才能使用零截距模型,比如奥肯(Okun)定律和其他经济理论。第三十九页,本课件共有45页
22、5.10 关于度量比例和单位的说明 在经济研究中我们经常使用不同的度量单位,例如人口用亿或百万,产值也经常用亿元或百万元,出口有用亿美元或万美元等,不同的度量单位表示数据回归分析的方程是一样的吗?回答是:截距项、系数可能不同,但它们相差的就是不同数量级表示的倍数,标准误差也如此,但t值与r2相同。第四十页,本课件共有45页5.11 不同模型小节模型形式斜率弹性系数线性B2双对数对数线性(半对数)线性对数倒数第四十一页,本课件共有45页5.12 本章小节 经济理论对建模有很大的帮助。建模不仅需要经济理论,还需要工作经验,经验需要不断的实践与积累。在选择模型时,不应过分强调而且不要仅仅根据一个统计
23、量,比如R2来判定。模型的建立需要正确的理论、可靠的数据、对各种模型统计性质的完整理解以及经验判断。注意选择的数据单位,因为回归系数的解释可能因度量单位不同而不同。第四十二页,本课件共有45页1、用多项式模型研究吸烟与肺癌之间的关系,看看吸烟对肺癌是递增效应还是递减效应,可考虑二项式或三项式模型。2、对回归结果做出解释。3、研究吸烟与其它癌症之间的关系。癌症与吸烟.xls习题1:各种癌症与吸烟的关系(经济计量学精要P.198表99)第四十三页,本课件共有45页习题2(经济计量学精要P.207习题917):根据下表数据研究GNP(Y)和货币供给(X)之间的关系年GNP(10亿美元)M2年GNP(
24、10亿美元)M219731359.386119813052.61795.519741472.8908.519823166195419751598.41023.219833405.72185.219761782.81163.719843772.22363.619771990.51286.719854014.92562.619782249.7138919864240.32807.719792508.21500.219874526.72901198027321633.1第四十四页,本课件共有45页习题2:问题:1、利用双对数模型分析;2、利用增长模型(对数线性模型)分析;3、利用线性对数模型分析;4、利用线性模型分析;5、解释每个模型斜率的意义;6、估计每个模型GNP对货币供给的弹性,并解释;7、所有的R2值可直接比较吗?哪些可比较?8、你觉得哪个模型较好?你选择的理由。9、货币学家认为,货币供给的变化率与GDP之间存在一一对应的关系。上述结果证实了这个观点吗?如何验证?第四十五页,本课件共有45页