《计量经济学书后答案__书第1-10章.pdf》由会员分享,可在线阅读,更多相关《计量经济学书后答案__书第1-10章.pdf(52页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第一章导论1计量经济学是一门什么样的学科?答:答:计量经济学的英文单词是 Econometrics,本意是“经济计量”,研究经济问题的计量方法,因此有时也译为“经济计量学”。将 Econometrics 译为“计量经济学”是为了强调它是现代经济学的一门分支学科,不仅要研究经济问题的计量方法,还要研究经济问题发展变化的数量规律。可以认为,计量经济学是以经济理论为指导,以经济数据为依据,以数学、统计方法为手段,通过建立、估计、检验经济模型,揭示客观经济活动中存在的随机因果关系的一门应用经济学的分支学科。2计量经济学与经济理论、数学、统计学的联系和区别是什么?答:答:计量经济学是经济理论、数学、统计
2、学的结合,是经济学、数学、统计学的交叉学科(或边缘学科)。计量经济学与经济学、数学、统计学的联系主要是计量经济学对这些学科的应用。计量经济学对经济学的应用主要体现在以下几个方面:第一,计量经济学模型的选择和确定,包括对变量和经济模型的选择,需要经济学理论提供依据和思路;第二,计量经济分析中对经济模型的修改和调整,如改变函数形式、增减变量等,需要有经济理论的指导和把握;第三,计量经济分析结果的解读和应用也需要经济理论提供基础、背景和思路。计量经济学对统计学的应用,至少有两个重要方面:一是计量经济分析所采用的数据的收集与处理、参数的估计等,需要使用统计学的方法和技术来完成;一是参数估计值、模型的预
3、测结果的可靠性,需要使用统计方法加以分析、判断。计量经济学对数学的应用也是多方面的,首先,对非线性函数进行线性转化的方法和技巧,是数学在计量经济学中的应用;其次,任何的参数估计归根结底都是数学运算,较复杂的参数估计方法,或者较复杂的模型的参数估计,更需要相当的数学知识和数学运算能力,另外,在计量经济理论和方法的研究方面,需要用到许多的数学知识和原理。计量经济学与经济学、数学、统计学的区别也很明显,经济学、数学、统计学中的任何一门学科,都不能替代计量经济学,这三门学科简单地合起来,也不能替代计量经济学。计量经济学与经济学的主要区别在于:经济学一般根据逻辑推理得出结论,说明经济现象和过程的本质与规
4、律,大多是定性的表述。虽然理论经济学有时也会涉及经济现象和过程的数量关系,如产出随投入要素的增减而增减,但不提供这类数量关系的具体度量,不说明随投入要素的增减产出增减多少。计量经济学则要对经济理论所确定的数量关系作出具体估计,也就是对经济理论进行经验的证明。计量经济学与统计学最根本的区别在于:第一,计量经济学是以问题为导向,以经济模型为核心的,统计学则是以数据为核心,常常也是以数据为导向的。虽然现代统计学并不排斥经济理论和模型,有时也会利用它们,但不一定以特定的经济理论或模型为基础和出发点,常常可以通过对经济数据的统计直接得出结论,侧重于数据的采集、筛选和处理;第二,计量经济学对经济理论的实证
5、作用较强。计量经济学从经济理论和经济模型出发,进行分析的过程,实际上是对经济理论证实或证伪的过程。这使得它对经济理论的验证作用很强,比统计学强的多;第三,计量经济学对经济问题有更重要的指导作用。计量经济学通常不仅要对数据进行处理和分析,获得经济问题的一些数字特征,而且要借助于经济理论和数学工具,对经济问题作出更深刻的解剖和解读。经过计量经济分析实证检验的经济理论和模型,能对分析、研究和预测更广泛的经济问题起到重要作用。计量经济学与数学的区别不言而喻,因为数学只是计量经济分析及其理论研究的工具,与实证分析经济问题的计量经济学的区别显而易见。13经典计量经济学与非经典计量经济学是如何划分的?答:答
6、:经典计量经济学与非经典计量经济学的划分可从计量经济学的发展时期及其理论方法上的特征来把握。经典计量经济学一般指上世纪70 年代以前发展起来的计量经济学,在理论方法上具有以下五个方面的共同特征:第一,在模型类型上,采用随机模型;第二,在模型导向上,以经济理论为导向;第三,在模型结构上,采用线性或可化为线性的模型,反映变量之间的因果关系;第四,在数据类型上,采用时间序列数据或截面数据;第五,在估计方法上,采用最小二乘法或最大似然法。非经典计量经济学一般指上世纪70 年代以后发展起来的计量经济学,也称现代计量经济学,与经典计量经济学理论方法上的五个方面的特征相对应,非经典计量经济学包括模型类型非经
7、典计量经济学问题、模型导向非经典计量经济学问题、模型结构非经典计量经济学问题、数据类型非经典计量经济学问题、估计方法非经典计量经济学问题五个方面的内容。4计量经济研究中如何进行理论模型的设定?答:答:理论模型的设定,是对经济问题的数学描述或模拟,涉及变量的设定、模型函数形式的设定、参数取值范围的设定三个方面。理论模型设定中变量的设定,主要是解释变量的设定,因为被解释变量是作为研究对象的变量,可由研究问题本身直接确定。解释变量的设定需要通过以下几个方面把握:第一,解释变量应是根据经济理论或实践经验确定的被解释变量的主要影响因素,遗漏了主要影响因素或将次要影响因素甚至不相关因素引入模型,都可能导致
8、研究结果的偏误;第二,若有多个解释变量,需注意避免解释变量之间的相关性。解释变量之间若存在一定的相关关系,可直接影响参数估计量的性质,降低研究结果的可靠性;第三,在设定解释变量的同时,应注意保证与解释变量对应的观察数据的可得性,没有样本观察数据的支持,就得不到模型的参数估计值,进一步的研究也将无法展开。模型函数形式的设定,首先,可以直接采用数理经济学已有的函数形式,另外,也可以根据样本观察数据反映出来的变量之间的关系设定,对于其他事先无法确定模型函数形式的情况,可采用各种可能的函数形式进行模拟,选择模拟结果最好的函数形式。需要指出的是,这里设定的模型函数形式只是模型函数形式的初步设定,在模型参
9、数估计和检验的过程中,大多还会对模型的函数形式进行逐步调整,以得到较为合理的模型函数形式。参数取值范围的设定主要根据经济理论或实践经验给出,参数取值范围的设定可用来检验模型参数估计结果的合理性。5计量经济学模型中的待估参数有哪些?答:答:计量经济学模型的参数包括模型的结构参数和随机误差项的分布参数两大类。模型的结构乘数是包含在模型方程中的反映模型结构特征的参数,每一个结构参数以一个字母(多为希腊字母)表示,例如生产函数模型中的参数A、,消费函数中的参数、,都是模型的结构参数。随机误差项的分布参数主要是随机误差项的均值和方差。6计量经济学模型的检验包括哪几个方面?为什么要进行模型的检验?答:答:
10、因为经济现象和过程本身是十分复杂的,理论模型的整个建立过程,从模型设定到参数估计,都可能存在一定的偏误。在模型设定过程中,可能由于所依据的经济理论对研究对象的解释不充分,或者由于自身对研究对象的认识的欠缺,导致变量选择的偏差或模型函数形式设定的错误;在模型参数估计过程中,可能由于样本数据的统计错误、代表性差,或者由于其他信息的不可靠,2导致参数估计值与真实值存在较大差距。此外,无论是单方程计量经济学模型,还是联立方程计量经济学模型,都是建立在一定的假设前提下的,如果模型的建立违背了计量经济学的基本假设,也会导致错误的结果。对模型的检验通常包括经济意义经验、统计推断检验、计量经济检验、模型预测检
11、验四个方面。7如何利用计量经济学模型进行政策评价?答:答:政策评价是将经济目标作为被解释变量,将经济政策作为解释变量,利用计量经济学模型对各种可供选择的经济政策方案的实施后果进行模拟测算,从中选择较好的政策方案。计量经济学模型用于政策评价,主要有三种方法:1)工具目标法。给定经济目标,即给定被解释变量的取值,通过对模型求解,确定解释变量的取值,即确定具体的经济政策方案。2)政策模拟。将各种不同的政策方案代入模型,计算各自的目标值,通过对目标值的比较决定经济政策方案的取舍。3)最优控制方法。将计量经济学模型与最优化方法结合起来,选择使目标达到最优的政策或政策组合。8计量经济学模型中的被解释变量和
12、解释变量、内生变量和外生变量是如何划分的?答:答:在单方程计量经济学模型中,按照因果差异,将变量分为被解释变量(explained variable)与解释变量(explanatory variable)。被解释变量是模型的分析研究对象,是具有某种概率分布的随机变量,也称为“因变量”或“应变量”(dependent variable)、“回归子”(regressand)等。解释变量是分析研究对象的主要影响因素,是确定性的变量,也称为“自变量”(independent variable)、“回归元”(regressor)等。在联立方程计量经济学模型中,按是否由模型系统决定,将变量分为内生变量(e
13、ndogenousvariables)和外生变量(exogenous variables)两大类。内生变量是由模型系统决定同时可能也对模型系统产生影响的变量,是具有某种概率分布的随机变量,外生变量是不由模型系统决定但对模型系统产生影响的变量,是确定性的变量。9计量经济学模型中包含的变量之间的关系主要有哪些?答:答:计量经济学模型中变量之间的关系主要是解释变量与被解释变量之间的因果关系,包括单向因果关系、相互影响关系、相互影响关系。1)单向因果关系经济变量之间的单向因果关系是单方程计量经济学模型研究的对象,指经济变量之间存在单向的内在联系,一个(一组)经济变量的水平直接影响或决定另一个经济变量的
14、水平。2)相互影响关系经济变量之间的相互影响关系是联立方程计量经济学模型研究的对象,指变量之间存在双向的因果关系,即一变量的变化既引起另一变量的变化,反过来也受另一变量变化的影响。3)相互影响关系恒等关系是一种特殊的变量关系,实际上通常就是一些变量的定义,例如,储蓄等于可支配收入减去消费。恒等关系是变量之间的确定关系,不需要针对它们进行分析。10什么是行为方程、技术方程、制度方程、定义方程、平衡方程?各举一例说明。答:答:方程是关于变量之间关系的表达式,计量经济学模型中的方程分为随机方程、恒等方程两大3类。随机方程主要包括行为方程、技术方程、制度方程等,恒等方程主要包括定义方程、平衡方程等。行
15、为方程是反映居民、企业、政府经济行为的随机方程。如描述居民消费与收入等的关系的消费函数方程,反映居民的消费行为,是一个行为方程;技术方程是反映客观经济技术关系的随机方程。如描述产出与投入要素之间关系的生产函数方程,反映一定生产技术条件下投入要素与产出之间的技术关系,是一个技术方程;制度方程是反映政府政策、规定的随机方程。如描述税收与课税对象数额、税率之间关系的税收函数方程,反映政府的税收规定,是一个制度方程;定义方程是反映经济学或经济统计学对经济变量的定义的恒等方程。以宏观经济学对国内生产总值的定义为例,按生产法,国内生产总值等于第一产业、第二产业、第三产业的增加值之和;平衡方程是反映经济变量
16、之间的某种平衡关系的恒等方程。如描述某种产品的供给等于需求的方程,反映该种产品的市场供需均衡,是一个平衡方程。11什么是单方程模型、联立方程模型、时间序列模型?三者之间的关系如何?答:答:单方程模型(single-equation model)是只含有一个方程的计量经济学模型;联立方程模型(simultaneous-equation model)是由多个方程组成的计量经济学模型;时间序列模型(time seriesmodel)是反映经济变量与时间变量之间关系的计量经济学模型。单方程模型、联立方程模型、时间序列模型分别适用于不同的情况和问题,分析方法也有区别。但这三种模型之间也有联系,联立方程模
17、型是由多个单方程模型有机组合而成,单方程模型在联立方程模型中有很多应用,时间序列模型也是一种单方程模型。12计量经济学中常用的数据类型有哪些?各举一例说明。答:答:根据生成过程和结构方面的差异,计量经济学中应用的数据可分为时间序列数据(time seriesdata)、截面数据(cross sectional data)、面板数据(panal data)和虚拟变量数据(dummy variablesdata)。时间序列数据是同一观察对象在不同时间点上的取值的统计序列,可理解为随时间变化而生成的数据。根据统计或观察的时间间隔的不同,时间序列数据有“年度数据”、“季节数据”、“月份数据”之分。比如
18、说年度 CPI、季节 CPI、月份 CPI。截面数据是许多不同的观察对象在同一时间点上的取值的统计数据集合,可理解为对一个随机变量重复抽样获得的数据。例如,以某100 个居民家庭为样本,研究居民家庭的消费与收入之间的关系,这 100 个家庭的完整的收入和消费数据就是一个截面数据。面板数据是结合了时间序列数据和截面数据特征的数据,是多个观察对象在不同时间点上的取值的统计数据集合。例如,以某 100 个居民家庭为样本,研究从 19902005 年居民家庭的消费与收入之间的关系,这 16 年来的 100 个家庭的完整的收入和消费数据就是一个面板数据。虚拟变量数据是人为设定的虚拟变量的取值。例如人的性
19、别分为女性和男性,可以用 0 和 1来表示。13什么是数据的完整性、准确性、可比性、一致性?答:答:1)完整性,指模型中所有变量在每个样本点上都必须有观察数据,所有变量的样本观察数据都一样多。2)准确性,指样本数据必须准确反映经济变量的状态或水平。数据的准确性与样本数据的采集直接相关,通常是研究者所不能控制的。43)可比性,指数据的统计口径必须相同,不同样本点上的数据要有可比性。4)一致性,指母体与样本即变量与数据必须一致。14计量经济学作为一门独立的经济学科正式诞生的标志是什么?答:答:计量经济学作为一门独立的学科,一般认为正式诞生于二十世纪三十年代初,其标志是:1930年挪威经济学家弗里希
20、(R.Frisch)、荷兰经济学家丁伯根(J.Tinbergen)、美国经济学家费歇尔(I.Fisher)等在美国俄亥俄州克里夫兰组织成立世界计量经济学会(Econometric Society);1933年世界计量经济学会会刊计量经济学(Econometrica)创刊。15试论计量经济学在经济学科中的地位。答:答:理论与方法的迅速发展和在经济活动实践中的广泛应用,使计量经济学在经济学科中占有了十分突出的地位。一般认为,1969 年诺贝尔经济学奖的设立,标志着经济学已成为一门科学。在经济学走向科学化的过程中,计量经济学起了特殊作用,因而 1969 年的首届诺贝尔经济学奖授予了创立计量经济学的弗
21、里希和丁伯根。据统计,在历届诺贝尔经济学奖获得者中,有2/3 以上是计量经济学家,有 10 位直接因为对计量经济学发展的贡献而获奖;有近20 位担任过世界计量经济学会会长;有 30 余位在获奖成果中应用了计量经济学。为此,第二届诺贝尔经济学奖得主美国著名经济学家萨缪尔森评价说:“第二次世界大战后的经济学是计量经济学时代”;第十二届诺贝尔经济学奖得主美国著名经济学家克莱因评价说:“计量经济学已经在经济学科中居于最重要的位置”。5第二章一元线性回归模型1什么是相关分析?什么是回归分析?相关分析与回归分析的关系如何?答:答:相关分析(correlation analysis)是研究变量之间的相关关系
22、的形式和程度的一种统计分析方法,主要通过绘制变量之间关系的散点图和计算变量之间的相关系数进行。回归分析(regression analysis)是研究不仅存在相关关系而且存在因果关系的变量之间的依存关系的一种分析理论与方法,是计量经济学的方法论基础。相关分析与回归分析既有联系又有区别。联系在于:相关分析与回归分析都是对存在相关关系的变量的统计相关关系的研究,都能测度线性相关程度的大小,都能判断线性相关关系是正相关还是负相关。区别在于:相关分析仅仅是从统计数据上测度变量之间的相关程度,不考虑两者之间是否存在因果关系,因而变量的地位在相关分析中是对等的;回归分析是对变量之间的因果关系的分析,变量的
23、地位是不对等的,有被解释变量和解释变量之分。2随机误差项在计量经济学模型中的作用是什么?答:答:计量经济学是研究经济变量之间存在的随机因果关系的理论与方法,其中对经济变量之间关系的随机性的描述通过引入随机误差项(stochastic error)的方式来实现。一个经济变量通常不能被另一个经济变量完全精确地决定,需要引入随机误差项来反映各种误差的综合影响,主要包括:1)变量的内在随机性的影响;2)解释变量中被忽略的因素的影响;3)模型关系设定误差的影响;4)变量观察值的观察误差的影响;5)其他随机因素的影响。3什么是总体回归函数?什么是总体回归模型?答:答:给定解释变量条件下被解释变量的期望轨迹
24、称为总体回归曲线(population regression curve),或总体回归线(population regression line)。描述总体回归曲线的函数称为总体回归函数(populationregression function)。对于只有一个解释变量X的情形,总体回归函数为E(Y/Xi)(f Xi)表示对于解释变量X的每一个取值Xi,都有被解释变量Y的条件期望E与之对应,(Y/Xi)是X的函数。E(Y/Xi)对于含有多个解释变量X1、X2、Xk的情形,总体回归函数为E(Y/X1i,X2i,Xki)(f X1i,X2i,Xki)表示对于解释变量X1、X2、Xk的每一组取值X1i
25、、X2i、Xki,都有被解释变量Y的条件期望E(Y/X1i,X2i,Xki)与之对应,E是X1、X2、Xk的函数。(Y/X1i,X2i,Xki)引入了随机误差项,称为总体回归函数的随机设定形式,也是因为引入了随机误差项,成为计量经济学模型,称为总体回归模型(population regression model)。64什么是样本回归函数?什么是样本回归模型?答:答:由于总体中包含的个体的数量往往非常多,总体回归函数的具体形式一般无法精确确定,是未知的,通常只能根据经济理论或实践经验对总体回归函数进行合理的假设,然后根据有限的样本观察数据对总体回归函数进行估计。根据样本数据对总体回归函数作出的估
26、计称为样本回归函数(simple regression function)。引入样本回归函数中的代表各种随机因素影响的随机变量,称为样本残差项、回归残差项或样本剩余项、回归剩余项,简称残差项或剩余项(residual),通常用ei表示。在样本回归函数中引入残差项后,得到的是随机方程,成为了计量经济学模型,称为样本回归模型。5线性回归模型中“线性”的含义是什么?答:答:线性函数和通常意义下的线性函数不同,这里的线性函数指参数是线性的,即待估参数都只以一次方出现,解释变量可以是线性的,也可以不是线性的。例如2,nYi01ln Xiii 1,2,nYi01X12i2X2ikXkiii 1,32,nY
27、i01X1i()(ii 1,2X1i/X2i8kXki X2i)都是线性回归模型。2,nYi012Xiii 1,2,nYi0(102)X1i1X2ikXkiii 1,22,nYi01X1iln2X2ikXkiii 1,都不是线性回归模型。6为什么要对模型提出假设?一元线性回归模型的基本假设有哪些?答:答:线性回归模型的参数估计方法很多,但各种估计方法都是建立在一定的假设前提之下的,只有满足假设,才能保证参数估计结果的可靠性。为此,本节首先介绍模型的基本假设。一元线性回归模型的基本假设包括对解释变量的假设、对随机误差项的假设、对模型设定的假设几个方面,主要如下:1)解释变量是确定性变量,不是随机
28、变量。2)随机误差项具有 0 均值、同方差,且在不同样本点之间是独立的,不存在序列相关,即E(i)0i 1,2,nVar(i)2i 1,2,nCov(i,j)0i ji,j 1,2,n3)随机误差项与解释变量不相关。即Cov(Xi,i)0i 1,2,n4)随机误差项服从正态分布,即i N(0,2)i 1,2,n5)回归模型是正确设定的。7这 5 条假设中的前 4 条是线性回归模型的古典假设,也称为高斯假设,满足古典假设的线性回归模型称为古典线性回归模型(classical linear regression model)。7参数的普通最小二乘估计法和最大似然估计法的基本思想各是什么?答:答:普
29、通最小二乘法(ordinary least squares,OLS)是最常用的参数估计方法,其基本思想是使样本回归函数尽可能好地拟合样本数据,反映在图上,就是要使样本散点偏离样本回归直线的距离总体上最小。在样本容量为 n 的情况下,就是要使 n 个样本点的被解释变量的估计值与实际观察值的偏差总体上最小。为避免残差的正负抵消,同时考虑计算处理上的方便,最小二乘法以minei2i1n表示被解释变量的估计值与实际观察值的偏差总体上最小,称为最小二乘准则。最大似然法(maximum likelihood,ML),也称为最大或然法或极大似然法。最大似然法的基本思想是使从模型中取得样本观察数据的概率最大,
30、就是说把随机抽取得到的样本观察数据看作是重复抽取中最容易得到的样本观察数据,即概率最大,参数估计结果应该反映这一情况,使得到的模型能以最大概率产生样本数据。8普通最小二乘参数估计量和估计值各有哪些性质?答:答:在满足基本假设情况下,一元线性回归模型的普通最小二乘参数估计量是最佳线性无偏估计量。用普通最小二乘法估计得到的一元线性回归模型的样本回归函数具有如下性质:X;(Y、X)1.样本回归线过样本均值点,即点满足样本回归函数Yi01iY;2.被解释变量的估计的均值等于实际值的均值,即Y3.残差和为零,即ei1ni 0;n4.解释变量与残差的乘积之和为零,即X ei1i i 0;n5.被解释变量的
31、估计与残差的乘积之和为零,即Yei1ii 0。9随机误差项方差的普通最小二乘估计和最大似然估计各是什么?是否是无偏估计?随机误差项的方差的普通最小二乘估计量为2ei1n2in28是一个无偏估计量。随机误差项的方差的最大似然估计量为1n2 eini12与普通最小二乘估计量不同,随机误差项的方差的最大似然估计量是一个有偏估计量。10什么是拟合优度?什么是拟合优度检验?拟合优度通过什么指标度量?为什么残差平方和不能作为拟合优度的度量指标?答:答:拟合优度指样本回归线对样本数据拟合的精确程度,拟合优度检验就是检验样本回归线对样本数据拟合的精确程度。样本残差平方和是一个可用来描述模型拟合效果的指标,残差
32、平方和越大,表明拟合效果越差;残差平方和越小,表明拟合效果越好。但残差平方和是一个绝对指标,不具有横向可比性,不能作为度量拟合优度的统计量。所以拟合优度检验的度量指标是通过残差平方和构造的决定系数来进行检验的。决定系数公式是:R22ESSRSS1TSSTSS与残差平方和不同,决定系数R是一个相对指标,具有横向可比性,因此可以用作拟合优度检验。11一元线性回归模型的普通最小二乘参数估计量的分布如何?、满足线性性,可表示为被解释变量Y的线性组答:答:由于0、1的普通最小二乘估计量i01、也服从正态分布。合,所以01所以i1 N(,00nXi1n2inxi2 N(,)11n222i)xi1进行标准化
33、变换可得00SE(0)00Xi1ni1n(1)N(0,1)2i2nxi29111(2)1 N(0,1)2SE(1)xi1n2i其中,随机误差项i的方差的真实值未知,只能用其无偏估计量2222ei1n2in2、的方差和标准差的估计量分别称为、的替代后得到的替代。用无偏估计量0101表示,即、SE样本方差和样本标准差,样本方差和样本标准差可分别用Var()Var0Xi1ni1n2inxi2()Var122xi1n2i替代后,式(1)用、(2)中的统计量服从自由度为n2的t分布,将替代后的统计量分别记为t0、t1,有220t00SE(0)00Xi1ni1n(t n-2)2i2nxi211t111(t
34、 n-2)2SE(1)xi1n2i12什么是变量显著性检验?答:一元线性回归模型中,1是否显著不为 0,反映解释变量对被解释变量的影响是否显著,所以常针对原假设H0:1 0,备择假设H1:1 0,进行检验,称为变量显著性检验。原假设为H0:1 0,备择假设为H1:1 0时,根据原假设1t1(t n-2)SE(1)对于给定的显著性水平,查自由度为n2的t分布临界值,并计算t1的值,如果t1t,t2210接受原假设H0:1 0,认为解释变量对被解释变量的影响不显著;反之,如果t1 t2则拒绝原假设H0:1 0,接受备择假设H1:1 0,认为解释变量对被解释变量的影响显著。13为什么被解释变量总体均
35、值的预测置信区间比个别值的预测置信区间窄?答:答:被解释变量的总体均值E的波动,主要取决于样本数据的抽样波动。被解释变量的(Y/X0)个别值Y0的波动,除受样本数据的抽样波动的影响外,还受随机误差项i的影响。反映在式(Y(e)(2-50)、式(2-51)中,SE,总体均值的预测置信区间窄于个别值的预测置0 SE0信区间。14由 19812005 年的样本数据估计得到反映某一经济活动的计量经济学模型,利用模型对 2050 年该经济活动的情况进行预测,是否合适?为什么?答:答:因为在解释变量的样本均值X处,样本观察数据的代表性往往较好,即抽样波动往往较小,被解释变量的总体均值E和个别值Y0的波动较
36、小。反之,解释变量X的取值偏离X的(Y/X0)距离越大,样本观察数据的代表性往往越差,即抽样波动往往越大,被解释变量的总体均值和个别值Y0的波动越大。由此可见,用回归模型作预测时,解释变量的取值不宜偏离E(Y/X0)解释变量的样本均值X太大,否则预测精度会大大降低。所以利用模型对 2050 年的经济活动的情况进行预测不合适。15在一元线性回归模型Yi01Xii中,用不为零的常数去乘每一个 X 值,对参数0与1的估计值、Y 的拟合值、残差会产生什么样的影响?如果用不为零的常数去加每一个 X 值,又会怎样?X e,则有解答:解答:记原总体模型对应的样本回归模型为Yi01ii1Y 的拟合值与残差分别
37、为x yxi2iiY X,01XYi01iX)eiYi(01i11记X*Xi,则有X*Xn*iXx*Xi*X*xi记新总体模型对应的样本回归模型为01Xi*ei*Yi则有1x y(x)*ii*2ix yxii22ix yx1ii2i110Y 1X*Y 1X 1X Y 10于是在新的回归模型下,Y 的拟合值与残差分析分别为*1X XYX i01i01i01i1X*)Y(X)01Xi*)Yi(ei*Yi(01ii01i可见,用不为零的常数去乘每一个 X 值,1的估计值变为原来的1,0的估计值、Y 的拟合值与模型的残差不变。如果记Xi*Xi,xi*xi于是新模型的回归参数分别为1x y(x)*ii*
38、2ix yxii2i1(X*)Y X*0Y 1X*Y 11101在新的回归模型下,Y 的拟合值与残差分别为*YXi01i(01)1(Xi)01Xi)(X)Y(X)01Xi*)Yi(ei*Y(011ii01i可见,如果用不为零的常数去加每一个 X 值,0的估计值改变,模型的残差不变。1的估计值、Y 的拟合值与1216 在一元线性回归模型Yi01Xii中,用不为零的常数去乘每一个 Y 值,对参数0、1的估计值会产生什么样的影响?如果用不为零的常数去加每一个 Y 值,又会怎样?解答:记原总体模型对应的样本回归模型为Yi01Xiei,则有1xiyix2,0Y 1XiY 的拟合值与残差分别为Yi01Xi
39、eiYi(01Xi)记Y*Yi,则有Y*Y*inYy*Y*iY*yi记新总体模型对应的样本回归模型为Y*i01Xie*i则有1xiy*ixiyi(x)2xiyiix2ix21i0Y*1X Y 1X(Y 1X)0可见,用不为零的常数去乘每一个 Y 值,0、1的估计值会变为原来的倍。如果记Y*iYi,y*i yi于是新模型的回归参数分别为*iixiyi1x y(x)2ix21i0 Y*1X Y 1X Y 1X*0可见,用不为零的常数去加每一个 Y 值,0的估计值比原来增大、1的估计值不变。1317(注意:本题的数据有误,需做修改,(注意:本题的数据有误,需做修改,Y Y 的均值和平方和、的均值和平
40、方和、X X 的平方和做了修改)的平方和做了修改)由某公司分布在 12 个地区的销售点的销售量(Y)和销售价格(X)数据得出如下结果:X 621.3Y 205.6Xi12122i 5564218Yi1122i 529835X Y 1396698iii1121)建立销售量对价格的一元线性回归方程;2)求决定系数R。解答:解答:1)由已知条件知:Xi112i n X 7455.6Y nY 2467.2ii112故(Xi112i112i X)(YiY)(XiYiYXiYiX XY)i112XiYin XY-136173.36又因为1212(Xi1i X)(Xi22XiX X2)2i1 5564216
41、-12621.32 932053.7所以121x yii112ixi2i1-136173.36 0.146932053.7Y X 205.60.146621.3 296.309801所以销售量对价格的一元线性回归方程为:296.30980.146XYii2)由于)(Y22YY2RSS(YiYiiiiYi)2i1i11212 296.30980.146X,所以而Yii142RSS(Yi22YYiiYi)i12Yi2YYiiYiYi2Yi(01Xi)(01Xi)222i112i1i1i1i120i112121212121212 Yi20Yi21XiYi12201Xi2i1i1i1i11212122
42、1Xi1122i 5298352296.30982467.220.146139669812296.309822296.30980.1467455.6+0.14625564218 2683.716TSS(YiY)Yi2nY22i1i11212529835-12205.62 22578.68所以R21RSS2683.7161 0.88TSS22578.6818 华尔街日报 1999 年年鉴(The Wall Street Journal Almanac 1999)公布的美国各航空公司业绩统计数据显示,各航空公司航班正点到达比率和每10 万乘客投诉次数如表 2-9 所示。表 2-9美国各航空公司航班
43、正点到达比率和每10 万乘客投诉次数航空公司名称西南(Southwest)航空公司大陆(Continental)航空公司西北(Northwest)航空公司美国(US Airways)航空公司联合(United)航空公司美洲(American)航空公司德尔塔(Delta)航空公司美国西部(Americawest)航空公司环球(TWA)航空公司要求:1)画出这些数据的散点图;2)根据散点图确定两变量之间存在什么关系;3)求投诉率对航班正点到达比率的回归方程;4)对回归方程的斜率的意义作出解释;5)如果航班正点率为 80%,估计每 10 万旅客投诉的次数是多少。解答:1)设投诉率为被解释变量 y,航
44、班正点达比率为解释变量 x,以 y 为纵轴,以 x 为横轴作散点图。航班正点率(%)投诉率(次/10 万乘客)81.876.676.675.773.872.271.270.868.50.210.580.850.680.740.930.721.221.2515y0.2680.40.60.81.01.2707274x767880822)根据散点图可确定两变量之间反向的相关关系,并呈现线性关系。3)可得回归方程:i 6.017830.07041yxi(5.719)(-4.967)R2 0.7794)上述的回归结果的斜率表示,航班正点达比率提高1 个百分点,那么投诉率会将下降0.07041(次/10
45、万乘客);5)如果航班正点率为 80%,代入到回归方程,可得:6.017830.07041y80 0.38468(次/10万乘客)19我国 19792004 年的国内生产总值与财政收入数据如表2-10 所示。表 2-10我国国内生产总值与财政收入数据单位:亿元年份财政收入 Y国内生产总值X年份财政收入 Y国内生产总值 X1619791980198119821983198419851986198719881989199019911146.381159.931175.791212.331366.951642.862004.822122.012199.352357.242664.92937.1314
46、9.484038.24517.84862.45294.75934.571718964.410202.211962.514928.316909.218547.921617.819921993199419951996199719981999200020012002200320043483.374348.955218.16242.27407.998651.149875.9511444.0813395.2316386.0418903.6421715.2526396.4726638.134634.446759.458478.167884.674462.678345.282067.589403.69731
47、4.8105172.2117390.2136875.9要求:1)建立财政收入随国内生产总值变化的一元线性回归模型;2)对模型进行检验;3)若 2005 年的国内生产总值为 155936.8,求 2005 年财政收入的预测值和预测置信区间(取。=0.05)解答:1)建立财政收入随国内生产总值变化的一元线性回归模型:482.70.1662 XYii(-0.892)(18.411)R2 0.93392)从回归的结果看,模型拟合较好。可决系数为0.9339,表明模型在整体上拟合得非常好。从截距项与斜率项的 t 检验值看,在5%的显著性水平下,斜率项通过检验,而截距项则不能通过。去掉截距项,重新估计模型
48、,可得新的回归方程:0.1602 XYii(26.42)并且从斜率项的值看,00.1602|t|)(Intercept)5.097257.090890.7190.4798T0.032170.013832.3250.0297*ln(L)-1.056351.20352-0.8780.3896ln(K)0.954630.0579416.4757.34e-14*Signif.codes:0*0.001*0.01*0.05.0.1 1Residual standard error:0.05453 on 22 degrees of freedomMultiple R-squared:0.9974,Adju
49、sted R-squared:0.997F-statistic:2774 on 3 and 22 DF,p-value:|t|)(Intercept)1.549500.0901117.201.89e-13*log(X1)0.996920.0191152.17 2e-16*log(X2)-0.331360.02431-13.631.39e-11*-Signif.codes:0*0.001*0.01*0.05.0.1 1Residual standard error:0.01801 on 20 degrees of freedomMultiple R-squared:0.9941,Adjusted
50、 R-squared:0.9935F-statistic:1694 on 2 and 20 DF,p-value:|t|)(Intercept)28.255061.4214919.881.21e-14*X10.980850.0194550.42 2e-16*X2-0.258430.01528-16.912.59e-13*-Signif.codes:0*0.001*0.01*0.05.0.1 1Residual standard error:1.435 on 20 degrees of freedomMultiple R-squared:0.9939,Adjusted R-squared:0.9