《第三章 多元线性回归模型(Stata)(6页).doc》由会员分享,可在线阅读,更多相关《第三章 多元线性回归模型(Stata)(6页).doc(6页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、-第三章 多元线性回归模型(Stata)-第 6 页一、邹式检验(突变点检验、稳定性检验)1.突变点检验19852002年中国家用汽车拥有量(,万辆)与城镇居民家庭人均可支配收入(,元),数据见表。表6.1 中国家用汽车拥有量()与城镇居民家庭人均可支配收入()数据年份(万辆)(元)年份(万辆)(元)198519941986199542831987199619881997198919981990199958541991200062801992200119932002下图是关于和的散点图:从上图可以看出,1996年是一个突变点,当城镇居民家庭人均可支配收入突破元之后,城镇居民家庭购买家用汽车的能
2、力大大提高。现在用邹突变点检验法检验1996年是不是一个突变点。H0:两个字样本(19851995年,19962002年)相对应的模型回归参数相等H1:备择假设是两个子样本对应的回归参数不等。在19852002年样本范围内做回归。在回归结果中作如下步骤(邹氏检验):1、 Chow 模型稳定性检验(lrtest)用似然比作chow检验,chow检验的零假设:无结构变化,小概率发生结果变化* 估计前阶段模型* 估计后阶段模型* 整个区间上的估计结果保存为All* 用似然比检验检验结构没有发生变化的约束得到结果如下;(如何解释?)2.稳定性检验(邹氏稳定性检验)以表为例,在用19851999年数据建
3、立的模型基础上,检验当把20002002年数据加入样本后,模型的回归参数时候出现显著性变化。* 用F-test作chow间断点检验检验模型稳定性* chow检验的零假设:无结构变化,小概率发生结果变化* 估计前阶段模型* 估计后阶段模型* 整个区间上的估计结果保存为All* 用F检验检验结构没有发生变化的约束*计算和显示 F检验统计量公式,零假设:无结构变化然后 dis f_test则 得到结果;* F统计量的临界概率然后 得到结果* F统计量的临界值然后 得到结果(如何解释?)二、似然比(LR)检验有中国国债发行总量(,亿元)模型如下:其中表示国内生产总值(百亿元),表示年财政赤字额(亿元)
4、,表示年还本付息额(亿元)。19802001年数据见表。表国债发行总量、财政赤字额、年还本付息额()数据19801991198119921982199319831994198419951985199619861997198719981988199919892000199020014604对以上数据进行回归分析:得到以下结果:对应的回归表达式为: (0.2) (2.2) (31.5) (17.8)现在用似然比(LR)统计量检验约束对应的回归系数等于零是否成立。(现在不会)三、Wald检验(以表为例进行Wald检验,对输出结果进行检验。)检验过程如下:1. 已知数据如表YX1X2111032983
5、51541285-6(1) 先根据表中数据估计以下回归模型的方程:(2) 回答下列问题:吗?为什么?吗?为什么?对上述3个方程进行回归分析,结果分别如下:得到结果如下:得到结果如下:从上述回归结果可知:,。二元回归与分别对与所作的一元回归,其对应的参数估计不相等,主要原因在于与有很强的相关性。其相关分析结果如下:可见,两者的相关系数为。得到结果如下:3. 表列出了某地区家庭人均鸡肉年消费量Y与家庭月平均收入X,鸡肉价格P1,猪肉价格P2与牛肉价格P3的相关数据。年份Y/千克X/元P1/(元/千克)P2/(元/千克)P3/(元/千克)年份Y/千克X/元P1/(元/千克)P2/(元/千克)P3/(
6、元/千克)19803971992911198141319939311982439199410211983459199511651984492199613491985528199714491986560199815751987624199917591988666200019941989717200122581990768200224781991843(1) 求出该地区关于家庭鸡肉消费需求的如下模型:(2) 请分析,鸡肉的家庭消费需求是否受猪肉及牛肉价格的影响。先做回归分析,过程如下:依次生成变量 lnvar2 lnvar3 lnvar4 lnvar5 lnvar6回归结果如下:所以,回归方程为:
7、 (-2.463) (4.182) (-4.569) (1.483) (0.873)由上述回归结果可以知道,鸡肉消费需求受家庭收入水平和鸡肉价格的影响,而牛肉价格和猪肉价格对鸡肉消费需求的影响并不显著。(AIC 和SC 准则不会算)去掉猪肉价格P2与牛肉价格P3重新进行回归分析。得出结果如下:(AIC 和SC 准则不会算)2. 某硫酸厂生产的硫酸的透明度指标一直达不到优质要求,经分析透明度低与硫酸中金属杂质的含量太高有关。影响透明度的主要金属杂质是铁、钙、铅、镁等。通过正交试验的方法发现铁是影响硫酸透明度的最主要原因。测量了47组样本值,数据见表。表3.4 硫酸透明度y与铁杂质含量x数据序数X
8、Y序数XY1311902560502321902660413341802761524351402863345361502964406371203065257391103169308408132742094210033744010428034762511431103579301243803685251348683787161449803889161550503999201652704076201752504110020185360421002019544443110152054544411015215648451222722565046154202358564721020245852硫酸透明度与铁杂质含量的散点图如下:得到以下结果:所以应该建立非线性回归模型。1. 通过线性化的方式估计非线性模型。生成变量:(1)建立倒数模型:得到以下结果:所以倒数表达式为:(2)建立指数函数生成新变量:建立指数模型:得到结果如下:所以指数表达式为:lnvar3 = 1.99 + 104.5 X可决系数也由提高到,可见拟合为指数函数比倒数函数更好。2. 直接估计非线性回归模型(不会,也不明白为什么直接估计比对数线性化后的结果要好 = =)