《第二章 经典单方程计量经济学模型一元线性回归模型qls.docx》由会员分享,可在线阅读,更多相关《第二章 经典单方程计量经济学模型一元线性回归模型qls.docx(10页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第二章 经典典单方程计量量经济学模型型:一元线性性回归模型一、内容提要本章介绍了回归归分析的基本本思想与基本本方法。首先先,本章从总总体回归模型型与总体回归归函数、样本本回归模型与与样本回归函函数这两组概概念开始,建建立了回归分分析的基本思思想。总体回回归函数是对对总体变量间间关系的定量量表述,由总总体回归模型型在若干基本本假设下得到到,但它只是是建立在理论论之上,在现现实中只能先先从总体中抽抽取一个样本本,获得样本本回归函数,并并用它对总体体回归函数做做出统计推断断。本章的一个重点点是如何获取取线性的样本本回归函数,主主要涉及到普普通最小二乘乘法(OLSS)的学习与与掌握。同时时,也介绍了了
2、极大似然估估计法(MLL)以及矩估估计法(MMM)。本章的另一个重重点是对样本本回归函数能能否代表总体体回归函数进进行统计推断断,即进行所所谓的统计检检验。统计检检验包括两个个方面,一是是先检验样本本回归函数与与样本点的“拟合优度”,第二是检检验样本回归归函数与总体体回归函数的的“接近”程度。后者者又包括两个个层次:第一一,检验解释释变量对被解解释变量是否否存在着显著著的线性影响响关系,通过过变量的t检检验完成;第第二,检验回回归函数与总总体回归函数数的“接近”程度,通过过参数估计值值的“区间检验”完成。本章还有三方面面的内容不容容忽视。其一一,若干基本本假设。样本本回归函数参参数的估计以以及
3、对参数估估计量的统计计性质的分析析以及所进行行的统计推断断都是建立在在这些基本假假设之上的。其其二,参数估估计量统计性性质的分析,包包括小样本性性质与大样本本性质,尤其其是无偏性、有有效性与一致致性构成了对对样本估计量量优劣的最主主要的衡量准准则。Gosss-marrkov定理理表明OLSS估计量是最最佳线性无偏偏估计量。其其三,运用样样本回归函数数进行预测,包包括被解释变变量条件均值值与个值的预预测,以及预预测置信区间间的计算及其其变化特征。二、典型例题分分析例1、令kidds表示一名名妇女生育孩孩子的数目,eeduc表示示该妇女接受受过教育的年年数。生育率率对教育年数数的简单回归归模型为(
4、1)随机扰动动项包含什么么样的因素?它们可能与与教育水平相相关吗?(2)上述简单单回归分析能能够揭示教育育对生育率在在其他条件不不变下的影响响吗?请解释释。解答:(1)收入、年年龄、家庭状状况、政府的的相关政策等等也是影响生生育率的重要要的因素,在在上述简单回回归模型中,它它们被包含在在了随机扰动动项之中。有有些因素可能能与教育水平平相关,如收收入水平与教教育水平往往往呈正相关、年年龄大小与教教育水平呈负负相关等。(2)当归结在在随机扰动项项中的重要影影响因素与模模型中的教育育水平eduuc相关时,上上述回归模型型不能够揭示示教育对生育育率在其他条条件不变下的的影响,因为为这时出现解解释变量与
5、随随机扰动项相相关的情形,基基本假设4不不满足。例2已知回归归模型,式中中E为某类公公司一名新员员工的起始薪薪金(元),NN为所受教育育水平(年)。随随机扰动项的的分布未知,其其他所有假设设都满足。(1)从直观及及经济角度解解释和。(2)OLS估估计量和满足线性性性、无偏性及及有效性吗?简单陈述理理由。(3)对参数的的假设检验还还能进行吗?简单陈述理理由。解答:(1)为接受过过N年教育的的员工的总体体平均起始薪薪金。当N为为零时,平均均薪金为,因因此表示没有有接受过教育育员工的平均均起始薪金。是每单位N变化所引起的E的变化,即表示每多接受一年学校教育所对应的薪金增加值。(2)OLS估估计量和仍
6、满足线性性性、无偏性性及有效性,因因为这些性质质的的成立无无需随机扰动动项的正态分分布假设。(3)如果的分分布未知,则则所有的假设设检验都是无无效的。因为为t检验与FF检验是建立立在的正态分分布假设之上上的。 例3、在在例2中,如如果被解释变变量新员工起起始薪金的计计量单位由元元改为1000元,估计的的截距项与斜斜率项有无变变化?如果解解释变量所受受教育水平的的度量单位由由年改为月,估估计的截距项项与斜率项有有无变化? 解答:首先考察被解释释变量度量单单位变化的情情形。以E*表示以百元元为度量单位位的薪金,则则由此有如下新模模型或 这里,。所以新新的回归系数数将为原始模模型回归系数数的1/10
7、00。 再考虑虑解释变量度度量单位变化化的情形。设设N*为用月月份表示的新新员工受教育育的时间长度度,则N*=12N,于于是或 可见,估计的截截距项不变,而而斜率项将为为原回归系数数的1/122。例4对于人均均存款与人均均收入之间的的关系式使用用美国36年年的年度数据据得如下估计计模型,括号号内为标准差差:0.5388(1)的经济解解释是什么?(2)和的符号号是什么?为为什么?实际际的符号与你你的直觉一致致吗?如果有有冲突的话,你你可以给出可可能的原因吗吗?(3)对于拟合合优度你有什什么看法吗?(4)检验是否否每一个回归归系数都与零零显著不同(在在1%水平下下)。同时对对零假设和备备择假设、检
8、检验统计值、其其分布和自由由度以及拒绝绝零假设的标标准进行陈述述。你的结论论是什么?解答: (1)为为收入的边际际储蓄倾向,表表示人均收入入每增加1美美元时人均储储蓄的预期平平均变化量。 (2)由由于收入为零零时,家庭仍仍会有支出,可可预期零收入入时的平均储储蓄为负,因因此符号应为为负。储蓄是是收入的一部部分,且会随随着收入的增增加而增加,因因此预期的符符号为正。实实际的回归式式中,的符号号为正,与预预期的一致。但但截距项为负负,与预期不不符。这可能能与由于模型型的错误设定定形造成的。如如家庭的人口口数可能影响响家庭的储蓄蓄形为,省略略该变量将对对截距项的估估计产生影响响;另一种可可能就是线性
9、性设定可能不不正确。 (3)拟拟合优度刻画画解释变量对对被解释变量量变化的解释释能力。模型型中53.88%的拟合优优度,表明收收入的变化可可以解释储蓄蓄中53.88 %的变动动。(4)检验单个个参数采用tt检验,零假假设为参数为为零,备择假假设为参数不不为零。双变变量情形下在在零假设下tt 分布的自自由度为n-2=36-2=34。由由t分布表知知,双侧1%下的临界值值位于2.7750与2.704之间间。斜率项计计算的t值为为0.0677/0.0111=6.009,截距项项计算的t值值为384.105/1151.1005=2.554。可见斜斜率项计算的的t 值大于于临界值,截截距项小于临临界值,
10、因此此拒绝斜率项项为零的假设设,但不拒绝绝截距项为零零的假设。三、教材中部分分习题2.1、为什么么计量经济学学模型的理论论方程中必须须包含随机干干扰项?计量经济模型考考察的是具有有因果关系的的随机变量间间的具体联系系方式。由于于是对基变量量,意味着影影响被解释变变量的因素是是复杂的除了了解释变量的的影响外,还还有其他无法法在模型中独独立列出的各各种因素的影影响。这样,模模型中就必须须使用一个随随机干扰项变变量来代表所所有这些在模模型中无法独独立表示出来来的影响因素素。(或见第一章习习题)2-2下列方方程哪些是正正确的?哪些些是错误的?为什么? 其中带“”者者表示“估计值”。答:错;正;错错;错
11、;错;正,正,错错。2.3、线性回回归模型有哪哪些基本假设设?违背基本本假设的计量量经济学模型型是否就不可可估计?答:线性回归模模型的基本假假设(实际是是针对普通最最小二乘法的的基本假设)有有两大类:一一类是关于解解释变量的,解解释变量是确确定性变量,而而且如果是随随机变量则解解释变量与随随机干扰项之之间互不相关关;一类是关关于随即干扰扰项的,随机机误差项具有有0均值和同同方差;随机机误差项在不不同样本点之之间是独立的的,不存在序序列相关;随随机误差项与与解释变量之之间不相关;随机误差项项服从0均值值、同方差的的正态分布。违违背基本假设设的计量经济济学模型还是是可以估计的的,只是不能能使用普通
12、最最小二乘法进进行估计。2.4、线性回回归模型 的0均值假设是是否可以表示示为?为什么么?(答:严格来说说,随机干扰扰项的0均值值假设是关于于X的条件期期望为0,线线性回归模型型:中的0均均值假设不可可以表示为:,因为前者者表示取完所所的可能的样样本组合后的的平均状态,而而后者只是一一个样本的平平均值。)二二者是两个完完全不同的概概念。2.5、假设已已经得到关系系的最小二乘乘估计,试回回答:假设决定把X变变量的计量单位扩大大10倍,这这样对远回归归的斜率和截截距有何影响响?如果Y变变量的单位扩扩大10倍,又又会怎样?答:如果Y变量的计计量单位扩大大10倍,斜斜率和截距系系数都将为原原始模型回归
13、归系数的1/102.10、下面面数据是对XX和Y的观察察值得到的。Yi=11110; Xi=16800; XiYi=2042200Xi2=3154400; Yi2=1333300假定满满足所有的古古典线性回归归模型的假设设,要求:(1)b1和bb2?(2)b1和bb2的标准差?(3)r2?(4)对B1、BB2分别建立995%的置信信区间?利用用置信区间法法,你可以接接受零假设:B2=0吗?(解:, , , ,自自由度为8,解得:的955%的置信区区间。同理,解得:为的95%的的置信区间。由由于不在的置信区区间内,故拒拒绝零假设:。2-11.表中中列出中国11978-22000年的的财政收入YY
14、和国内生产产总值GDPP的统计资料料。要求:1.作出散点图图(略)建立立Y随X变化化的一元线性性回归方程,并并解释斜率的的经济意义;2.对所建立的的回归方程进进行检验;3.若20011年中国GDDP为1055709亿元元,求财政收收入的预测值值及预测区间间。答:1.,斜率的经济意义义是:在19978-20000年间中中国国内生产产总值每增加加一亿元,财财政收入平均均增加0.11198亿元元。2.在5%的显显著性水平下下,自由度为为23-2=21的t分分布临界值为为2.08。因因此从参数的的t检验值看看,截距项和和斜率项都显显著不为零。另另外拟合优度度0.96009表明,财财政收入的996%的变化化可以由GDDP的变化来来解释,拟合合情况良好。3.当20011年GDP为为1057009亿元,预预测的财政收收入为5566.65+00.11988*1057709=133220.559(亿元);预测区间(参参考书中公式式首先算出随随机扰动项的的方差):财政收入的均值值预测区间为为132220.59-2.08*425.775, 113220.59+2.08*4225.75 财政收入的个值值预测区间为为132220.59-2.08*846.113, 113220.59+2.08*8446.13 10