《第三章多元线性回归模型Stata.docx》由会员分享,可在线阅读,更多相关《第三章多元线性回归模型Stata.docx(13页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、一、邹式检验(突变点检验、稳定性检验)1.突变点检验19852002年中国家用汽车拥有量(,万辆)与城镇居民家庭人均可支配收入(,元),数据见表6.1。表6.1 中国家用汽车拥有量()与城镇居民家庭人均可支配收入()数据年份(万辆)(元)年份(万辆)(元)198528.49739.11994205.423496.2198634.71899.61995249.964283198742.291002.21996289.674838.9198860.421181.41997358.365160.3198973.121375.71998423.655425.1199081.621510.2199953
2、3.885854199196.041700.62000625.3362801992118.22026.62001770.786859.61993155.772577.42002968.987702.8下图是关于和的散点图:从上图可以看出,1996年是一个突变点,当城镇居民家庭人均可支配收入突破4838.9元之后,城镇居民家庭购买家用汽车的能力大大提高。现在用邹突变点检验法检验1996年是不是一个突变点。H0:两个字样本(19851995年,19962002年)相对应的模型回归参数相等H1:备择假设是两个子样本对应的回归参数不等。在19852002年样本范围内做回归。在回归结果中作如下步骤(邹氏
3、检验):1、 Chow 模型稳定性检验(lrtest)用似然比作chow检验,chow检验的零假设:无结构变化,小概率发生结果变化* 估计前阶段模型* 估计后阶段模型* 整个区间上的估计结果保存为All* 用似然比检验检验结构没有发生变化的约束得到结果如下;(如何解释?)2.稳定性检验(邹氏稳定性检验)以表6.1为例,在用19851999年数据建立的模型基础上,检验当把20002002年数据加入样本后,模型的回归参数时候出现显著性变化。* 用F-test作chow间断点检验检验模型稳定性* chow检验的零假设:无结构变化,小概率发生结果变化* 估计前阶段模型* 估计后阶段模型* 整个区间上的
4、估计结果保存为All* 用F检验检验结构没有发生变化的约束*计算和显示 F检验统计量公式,零假设:无结构变化然后 dis f_test则 得到结果;* F统计量的临界概率然后 得到结果* F统计量的临界值然后 得到结果(如何解释?)二、似然比(LR)检验有中国国债发行总量(,亿元)模型如下:其中表示国内生产总值(百亿元),表示年财政赤字额(亿元),表示年还本付息额(亿元)。19802001年数据见表6.2。表6.2国债发行总量、财政赤字额、年还本付息额()数据198043.0145.17868.928.581991461.4216.178237.14246.81981121.7448.624-
5、37.3862.891992669.68266.381258.83438.57198283.8652.94717.6555.521993739.22346.344293.35336.22198379.4159.34542.5742.4719941175.25467.594574.52499.36198477.3471.7158.1628.919951549.76584.781581.52882.96198589.8589.644-0.5739.5619961967.28678.846529.561355.031986138.25102.02282.950.1719972476.82744.62
6、6582.421918.371987223.55119.62562.8379.8319983310.93783.452922.232352.921988270.78149.283133.9776.7619993715.03820.67461743.591910.531989407.97169.092158.8872.3720004180.1894.4222491.271579.821990375.45185.479146.49190.0720014604959.3332516.542007.73对以上数据进行回归分析:得到以下结果:对应的回归表达式为: (0.2) (2.2) (31.5) (
7、17.8)现在用似然比(LR)统计量检验约束对应的回归系数等于零是否成立。(现在不会)三、Wald检验(以表6.2为例进行Wald检验,对输出结果进行检验。)检验过程如下:1. 已知数据如表3.2YX1X211103298351541285-6(1) 先根据表中数据估计以下回归模型的方程:(2) 回答下列问题:吗?为什么?吗?为什么?对上述3个方程进行回归分析,结果分别如下:得到结果如下:得到结果如下:从上述回归结果可知:,。二元回归与分别对与所作的一元回归,其对应的参数估计不相等,主要原因在于与有很强的相关性。其相关分析结果如下:可见,两者的相关系数为0.9679。得到结果如下:3. 表3.
8、3列出了某地区家庭人均鸡肉年消费量Y与家庭月平均收入X,鸡肉价格P1,猪肉价格P2与牛肉价格P3的相关数据。年份Y/千克X/元P1/(元/千克)P2/(元/千克)P3/(元/千克)年份Y/千克X/元P1/(元/千克)P2/(元/千克)P3/(元/千克)19802.783974.225.077.8319924.189113.977.9111.4019812.994133.815.207.9219934.049315.219.5412.4119822.984394.035.407.9219944.0710214.899.4212.7619833.084593.955.537.9219954.011
9、1655.8312.3514.2919843.124923.735.477.7419964.2713495.7912.9914.3619853.335283.816.378.0219974.4114495.6711.7613.9219863.565603.936.988.0419984.6715756.3713.0916.5519873.646243.786.598.3919995.0617596.1612.9820.3319883.676663.846.458.5520005.0119945.8912.8021.9619893.847174.017.009.3720015.1722586.6
10、414.1022.1619904.047683.867.3210.6120025.2924787.0416.8223.2619914.038433.986.7810.48(1) 求出该地区关于家庭鸡肉消费需求的如下模型:(2) 请分析,鸡肉的家庭消费需求是否受猪肉及牛肉价格的影响。先做回归分析,过程如下:依次生成变量 lnvar2 lnvar3 lnvar4 lnvar5 lnvar6回归结果如下:所以,回归方程为: (-2.463) (4.182) (-4.569) (1.483) (0.873)由上述回归结果可以知道,鸡肉消费需求受家庭收入水平和鸡肉价格的影响,而牛肉价格和猪肉价格对鸡肉消
11、费需求的影响并不显著。(AIC 和SC 准则不会算)去掉猪肉价格P2与牛肉价格P3重新进行回归分析。得出结果如下:(AIC 和SC 准则不会算)2. 某硫酸厂生产的硫酸的透明度指标一直达不到优质要求,经分析透明度低与硫酸中金属杂质的含量太高有关。影响透明度的主要金属杂质是铁、钙、铅、镁等。通过正交试验的方法发现铁是影响硫酸透明度的最主要原因。测量了47组样本值,数据见表3.4。表3.4 硫酸透明度y与铁杂质含量x数据序数XY序数XY1311902560502321902660413341802761524351402863345361502964406371203065257391103169
12、308408132742094210033744010428034762511431103579301243803685251348683787161449803889161550503999201652704076201752504110020185360421002019544443110152054544411015215648451222722565046154202358564721020245852硫酸透明度与铁杂质含量的散点图如下:得到以下结果:所以应该建立非线性回归模型。1. 通过线性化的方式估计非线性模型。生成变量:(1)建立倒数模型:得到以下结果:所以倒数表达式为:Y = 0.069 2.37X(2)建立指数函数生成新变量:建立指数模型:得到结果如下:所以指数表达式为:lnvar3 = 1.99 + 104.5 X可决系数也由0.76提高到0.91,可见拟合为指数函数比倒数函数更好。2. 直接估计非线性回归模型(不会,也不明白为什么直接估计比对数线性化后的结果要好 = =)13