《计量经济学第四章练习题及参考解答.doc》由会员分享,可在线阅读,更多相关《计量经济学第四章练习题及参考解答.doc(14页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第四章练习题及参考解答4.1 假设在模型中,之间的相关系数为零,于是有人建议你进行如下回归:(1)是否存在?为什么?(2) (3)是否有?练习题4.1参考解答:(1) 存在。因为当之间的相关系数为零时,离差形式的有同理有:(2) 因为 ,且,由于,则 则 (3) 存在。因为当时,同理,有4.2在决定一个回归模型的“最优”解释变量集时人们常用逐步回归的方法。在逐步回归中既可采取每次引进一个解释变量的程序(逐步向前回归),也可以先把所有可能的解释变量都放在一个多元回归中,然后逐一地将它们剔除(逐步向后回归)。加进或剔除一个变量,通常是根据F检验看其对ESS的贡献而作出决定的。根据你现在对多重共线性
2、的认识,你赞成任何一种逐步回归的程序吗?为什么?练习题4.2参考解答:根据对多重共线性的理解,逐步向前和逐步向后回归的程序都存在不足。逐步向前法不能反映引进新的解释变量后的变化情况,即一旦引入就保留在方程中;逐步向后法则一旦某个解释变量被剔出就再也没有机会重新进入方程。而解释变量之间及其与被解释变量的相关关系与引入的变量个数及同时引入哪些变量而呈现出不同,所以要寻找到“最优”变量子集则采用逐步回归较好,它吸收了逐步向前和逐步向后的优点。4.3 下表给出了中国商品进口额Y、国内生产总值GDP、居民消费价格指数CPI。表4.11 中国商品进口额、国内生产总值、居民消费价格指数年份商品进口额(亿元)
3、国内生产总值(亿元)居民消费价格指数(1985=100)19851257.89016.0100.019861498.310275.2106.519871614.212058.6114.319882055.115042.8135.819892199.916992.3160.219902574.318667.8165.219913398.721781.5170.819924443.326923.5181.719935986.235333.9208.419949960.148197.9258.6199511048.160793.7302.8199611557.471176.6327.91997118
4、06.578973.0337.1199811626.184402.3334.4199913736.489677.1329.7200018638.899214.6331.0200120159.2.2333.3200224430.3.7330.6200334195.6.8334.6200446435.8.3347.7200554273.7.8353.9200663376.9 .5359.2200773284.6 .9376.5资料来源:中国统计年鉴,中国统计出版社2000年、2008年。请考虑下列模型:1)利用表中数据估计此模型的参数。2)你认为数据中有多重共线性吗? 3)进行以下回归:根据这些回
5、归你能对数据中多重共线性的性质说些什么?4)假设数据有多重共线性,但在5%水平上个别地显著,并且总的F检验也是显著的。对这样的情形,我们是否应考虑共线性的问题?练习题4.3参考解答:(1) 参数估计结果如下(括号内为标准误) (2)居民消费价格指数的回归系数的符号不能进行合理的经济意义解释,且CPI与GDP之间的简单相关系数呈现正向变动。可能数据中有多重共线性。计算相关系数:(3)最大的条件数(病态指数)CI=108.812,表明GDP与CPI之间存在较高的线性相关。 Spss软件中analyze/regression/linear的对话框中选Statistics选项框中点选Collinear
6、ity diagnostic共线性诊断,然后做回归。方差膨胀因子为3.381,小于10,不存在严重的多重共线性CoefficientsaModelCollinearity StatisticsToleranceVIF1x1.2963.381x2.2963.381a. Dependent Variable: y最大的条件数Collinearity DiagnosticsaModelDimension特征值Eigenvalue条件值或病态指数=Condition IndexVariance Proportions方差比例(Constant)GDPCPI112.7451.000.01.01.002.
7、2333.429=.15.29.003.02211.192=.85.70.99a. Dependent Variable: y方差比例值在第三行中均较大,表明常数项、GDP、CPI之间存在复共线性。 (4)分别拟合的回归模型如下: 方差膨胀因子VIF=1/(1-0.9309)= 14.47178,表明LnGDP与LnCPI之间存在较高的线性相关单方程拟合效果都很好,回归系数显著,可决系数较高,GDP和CPI对进口分别有显著的单一影响,在这两个变量同时引入模型时影响方向发生了改变,这只有通过相关系数的分析才能发现。(5)如果仅仅是作预测,可以不在意这种多重共线性,但如果是进行结构分析,还是应该引
8、起注意。4.4 自己找一个经济问题来建立多元线性回归模型,怎样选择变量和构造解释变量数据矩阵X才可能避免多重共线性的出现?练习题4.4参考解答: 本题很灵活,主要应注意以下问题:(1)选择变量时要有理论支持,即理论预期或假设;变量的数据要足够长,被解释变量与解释变量之间要有因果关系,并高度相关。(2)建模时尽量使解释变量之间不高度相关,或解释变量的线性组合不高度相关。4.5 克莱因与戈德伯格曾用1921-1950年(1942-1944年战争期间略去)美国国内消费Y和工资收入X1、非工资非农业收入X2、农业收入X3的时间序列资料,利用OLSE估计得出了下列回归方程:括号中的数据为相应参数估计量的
9、标准误差。试对上述模型进行评析,指出其中存在的问题。练习题4.5参考解答:从模型拟合结果可知,样本观测个数为27,消费模型的判定系数,F统计量为107.37,在0.05置信水平下查分子自由度为3,分母自由度为23的F临界值为3.028,计算的F值远大于临界值,表明回归方程是显著的。模型整体拟合程度较高。依据参数估计量及其标准误,可计算出各回归系数估计量的t统计量值:除外,其余的值都很小。工资收入X1的系数的t检验值虽然显著,但该系数的估计值过大,该值为工资收入对消费边际效应,因为它为1.059,意味着工资收入每增加一美元,消费支出的增长平均将超过一美元,这与经济理论和常识不符。另外,理论上非工
10、资非农业收入与农业收入也是消费行为的重要解释变量,但两者的t检验都没有通过。这些迹象表明,模型中存在严重的多重共线性,不同收入部分之间的相互关系,掩盖了各个部分对解释消费行为的单独影响。4.6 理论上认为影响能源消费需求总量的因素主要有经济发展水平、收入水平、产业发展、人民生活水平提高、能源转换技术等因素。为此,收集了中国能源消费总量Y (万吨标准煤)、国民总收入(亿元)X1(代表收入水平)、国内生产总值 (亿元)X2(代表经济发展水平)、工业增加值(亿元)X3、建筑业增加值(亿元)X4、交通运输邮电业增加值(亿元)X5(代表产业发展水平及产业结构)、人均生活电力消费 (千瓦小时)X6(代表人
11、民生活水平提高)、能源加工转换效率(%)X7(代表能源转换技术)等在1985-2007年期间的统计数据,具体如表4.2所示。表4.12 19852007年统计数据年份能源消费国民总收入国内生产总值工业增加值建筑业增加值交通运输邮电增加值人均生活电力消费能源加工转换效率yX1X2X3X4X5X6X719783645.21719794062.57919804545.62419814891.56119825323.35119835962.65219847208.0521985766829040.790163448.7417.9406.921.368.2919868085010274.410275.2
12、3967525.7475.623.268.3219878663212050.612058.64585.8665.8544.926.467.4819889299715036.815042.85777.281066131.266.5419899693417000.916992.3648479478635.366.5119909870318718.318667.86858859.41147.542.467.2199121826.221781.58087.11015.11409.746.965.9199226937.326923.510284.514151681.854.666.00199335260
13、35333.9141882266.52205.661.267.32199448108.548197.919480.72964.72898.372.765.2199559810.560793.724950.63728.83424.183.571.05199670142.571176.629447.64387.44068.593.171.5199777653.17897332921.44621.64593101.869.23199883024.384402.334018.44985.85178.4106.669.4419998818989677.135861.55172.15821.8118.26
14、9.19200098000.599214.64003.65522.37333.4132.469.042001.2.243580.65931.78406.1144.669.032002.7.747431.36465.59393.4156.369.042003.854945.57490.810098.4173.769.42004.7.3652108694.312147.6190.270.712005.1.876912.910133.810526.1216.771.082006.7.591310.911851.112481.1249.471.242007.2.9.214014.114604.1274
15、.971.25资料来源:中国统计年鉴,中国统计出版社2000、2008年版。要求:1)建立对数多元线性回归模型,分析回归结果。2)如果决定用表中全部变量作为解释变量,你预料会遇到多重共线性的问题吗?为什么?3)如果有多重共线性,你准备怎样解决这个问题?明确你的假设并说明全部计算。可是这里的lnX2和lnX5的参数符号为负,在经济意义上并不合理。说明多重共线性影响仍然很严重。 可是,这里的X2的参数为负,是不合理的。从经济意义上看,在各种回归结果中,选择X1 和x3的估计检验结果为:参数经济意义合理,其中的X3在下是显著的。相对说更为合理。4.7 在本章开始的“引子”提出的“农业的发展反而会减少
16、财政收入吗?”的例子中,如果所采用的数据如下表所示表4.13 1978-2007年财政收入及其影响因素数据年份财政收入(亿元)CS农业增加值(亿元)NZ工业增加值(亿元)GZ建筑业增加值(亿元)JZZ总人口(万人)TPOP最终消费(亿元)CUM受灾面积(千公顷)SZM19781132.31027.51607138.2962592239.15079019791146.41270.21769.7143.8975422633.73937019801159.91371.61996.5195.5987053007.94452619811175.81559.52048.4207.13361.5397901
17、9821212.31777.42162.3220.73714833130198313671978.42375.6270.64126.43471019841642.92316.12789316.74846.33189019852004.82564.43448.7417.95986.344365198621222788.73967525.76821.84714019872199.43233.04585.8665.87804.64209019882357.23865.45777.28109839.55087019892664.94265.9648479411164.24699119902937.15
18、062.06858859.412090.53847419913149.485342.28087.11015.114091.95547219923483.375866.610284.5141517203.35133319934348.956963.8141882266.521899.94882919945218.19572.719480.72964.729242.25504319956242.212135.824950.63728.836748.24582119967407.9914015.429447.64387.443919.54698919978651.1414441.932921.446
19、21.648140.65342919989875.9514817.634018.44985.851588.250145199911444.0814770.035861.55172.155636.949981200013395.2314944.74003.65522.36151654688200116386.0415781.343580.65931.766878.352215200218903.6416537.047431.36465.571691.247119200321715.2517381.754945.57490.877449.554506200426396.4721412.765210
20、8694.387032.937106200531649.2922420.076912.910133.896918.138818200638760.2024040.091310.911851.1.341091200751321.7828095.0.214014.1.648992(资料来源:中国统计年鉴2008,中国统计出版社2008年版)试分析:为什么会出现本章开始时所得到的异常结果?怎样解决所出现的问题?练习题4.7参考解答:(1)根据样本数据得到各解释变量的样本相关系数矩阵如下: 样本相关系数矩阵解释变量之间相关系数较高,特别是农业增加值、工业增加值、建筑业增加值、最终消费之间,相关系数都在
21、0.9以上。这显然与第三章对模型的无多重共线性假定不符合。(2)解决方案:采用逐步回归的方式,可以得到没有共线性的回归模型,但可能存在设定偏误。合并工业增加值与建筑业增加值得到第二产业gzjzz,估计财政收入与第二产业的回归。取对数再回归,可以减低共线性。变量回归模型F 对数财政收入Log(cs)与第二产业log(gzjzz)、最终消费log(cum)ln=0.1312+0.6368ln(gzjzz)+0.2382lncum t= (5.7695) (2.0022)0.9296192.5255对数财政收入Log(cs)与第二产业log(gzjzz)ln=0.5652+0.8403ln(gzjz
22、z) t= (18.5491)0.9221344.0706线性财政收入Cs与第二产业gzjzz、最终消费cum =-1274.546+0.2698gzjzz+0.0972cum t= (4.8621) (1.9184)0.9459254.5160最优线性财政收入Cs与第二产业gzjzz=-500.4812+0.3714gzjzz t= (21.4757) 0.9407461.2055对数模型结果:合并GZ,JZZ后估计结果线性回归模型合并GZ,JZZ后估计结果补充材料:2-2 国内生产总值构成本表按当年价格计算。单位:%国内生产年 份总 值第一产业第二产业第三产业工 业建筑业197810028
23、.247.944.13.823.9197910031.347.143.63.521.6198010030.248.243.94.321.6198110031.946.141.94.222198210033.444.840.64.121.8198310033.244.439.94.522.4198410032.143.138.74.424.8198510028.442.938.34.628.7198610027.243.738.65.129.1198710026.843.6385.529.6198810025.743.838.45.430.5198910025.142.838.24.732.11
24、99010027.141.336.74.631.6199110024.541.837.14.733.7199210021.843.438.25.334.8续表2-2国内生产总值构成199310019.746.640.26.433.7199410019.846.640.46.233.6199510019.947.2416.132.9199610019.747.541.46.232.8199710018.347.541.75.934.2199810017.646.240.35.936.2199910016.545.8405.837.7200010015.145.940.45.63920011001
25、4.445.139.75.440.5200210013.744.839.45.441.5200310012.84640.55.541.2200410013.446.240.85.440.4200510012.147.441.85.640.5200610011.14842.25.740.9200710010.847.341.65.841.9200810010.747.541.5641.8200910010.346.339.76.643.4201010010.146.840.16.743.12-3 不变价国内生产总值 单位:亿元年 份国内生产总 值第一产业第二产业第三产业工 业建筑业按1970年价
26、格计算19783548.29361766.21644.8121.484619793816.9993.519111787.2123.8912.419804116.2978.72170.32013.4156.9967.2按1980年价格计算19804567.91371.62213.42017.9195.5982.919814807.41467.42254.72053201.71085.319825242.81636.52380.12171.5208.61226.219835811.81772.82626.82382.6244.21412.219846693.82001.13007.22736.52
27、70.71685.519857595.220383565.63234.8330.81991.619868267.12105.739303546.7383.32231.419879224.72204.74468.24016.4451.82551.8续表2-3 不变价国内生产总值198810265.32260.85116.94629487.92887.6198910682.42330.35309.74863446.73042.4199011092.52501.1547850264523113.4按1990年价格计算199018547.950627717.46858859.45768.5199120
28、250.45183.58786.67845941.66280.3199223134.25427.110645.39505.71139.67061.8199326364.75682.312760.111415.41344.77922.3199429813.45909.615102.813574.21528.68801199533070.56205.217198.415480.31718.19667199636380.46521.719280.517416.21864.310578.2199739762.76749.921300.919387.81913.111711.9199842877.469
29、86.123198.921113.32085.612692.4199946144.67181.725086.322911.42174.913876.6200050035.27354.127451.725153.52298.215229.4按2000年价格计算200099214.614944.745555.940033.65522.3387142001.715363.249401.543504.65896.9426852002.315808.754257.347842.26415.147142.32003.916203.961132.753942.57190.251622.22004.51722
30、4.867926.160151.37774.856813.62005.718125.876133.167114.79018.463761.8按2005年价格计算2005.42242087598.177230.810367.374919.320062354199328.587175.112153.485511.62007.824422.4.6.114120.599179.72008.925735.9.7.415462.2.42009.826812.6.7.418331.3.4注:1.更换基期的年份有两个不变价数据,一个按上一基期价格计算,一个按新基期价格计算。 2.有关不变价国内生产总值的解释见简要说明。