《多元回归分析推断PPT讲稿.ppt》由会员分享,可在线阅读,更多相关《多元回归分析推断PPT讲稿.ppt(50页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、多元回归分析推断第1页,共50页,编辑于2022年,星期六受教育年限与每小时工资如果受教育年限的单位为月如果受教育年限的单位为日第2页,共50页,编辑于2022年,星期六OLS估计量的抽样分布估计量的抽样分布高斯高斯-马马尔尔科夫假定科夫假定假定假定1:关于参数:关于参数线线性性 y=0+1 x1+2 x2+k xk+u假定假定2:随机抽:随机抽样样假定假定3:不存在完全共:不存在完全共线线性性假定假定4:零条件均:零条件均值值 E(u|x1,x2,xk)=0假定假定5:同方差性:同方差性 Var(u|x1,xk)=2OLS估估计计量是量是BULUE 线线性性、无偏性、最小方差性性性、无偏性、
2、最小方差性第3页,共50页,编辑于2022年,星期六CLM假定假定高斯高斯-马尔科夫假定马尔科夫假定假定假定6:正态性:正态性 u N(0,2)CLM假定下,y的条件分布:y=0+1x1+2x2+kxk+u y|x N(0+1x1+2x2+kxk,2)在在CLM假定下,假定下,OLS估估计计量量 的抽的抽样样分布是什么?分布是什么?第4页,共50页,编辑于2022年,星期六线性性线性性 服从正服从正态态分布分布无偏性无偏性 的期望的期望为为j方差方差 定理定理4.14.1:CLM假定下,以自变量假定下,以自变量x为条件,有为条件,有第5页,共50页,编辑于2022年,星期六检验单参数假设:检验
3、单参数假设:t检验检验H0:1=0 H1:10 零假设与备择假设构造统计量0受教育年限与每小时工资 Z检验第6页,共50页,编辑于2022年,星期六 Z检验与t检验 定理定理4.24.2:标准化估计量的:标准化估计量的t分布分布 CLM假定下,以自变量假定下,以自变量x为条件,有为条件,有第7页,共50页,编辑于2022年,星期六 显著性检验(显著性检验(t检验)检验)原假设(原假设(null hypothesis):):例子:例子:原假设(H0:3=0)意味着,教育水平和工作经验相同时,男性和女性的工资没有差异。log(wage)=0+1 educ+2exper+3female+u 对于一元
4、回归,斜率系数的显著性检验:y=0+1x+u 原假设(H0:1=0)意味着什么?H0:j=0 第8页,共50页,编辑于2022年,星期六原假设与备择假设(原假设与备择假设(alternative hypothesis)如原假设不成立,该如何:双侧备择假设:相应的检验为双侧检验双侧检验(two-tailed test)单侧备择假设:或者 相应的检验为单侧检验单侧检验(one-tailed test)H0:j=0 H1:j0 H0:j=0 H1:j0H0:j=0 H1:j0 第13页,共50页,编辑于2022年,星期六备择假设:左侧是拒绝域。H1:j0 y=0+1x1+2x2+kxk+u若若 ,拒
5、,拒绝绝H0,xj对对y的影响是的影响是统计显统计显著的。著的。若若 ,不能拒,不能拒绝绝H0,xj对对y的影响的影响统计统计上不上不显显著。著。第15页,共50页,编辑于2022年,星期六若原假设和备择假设为:统计量的计算相同,判定规则不同:单侧检验和双侧检验的比较:t统计量的计算及其数值完全相同,临界值不同;查临界值时,t分布自由度相同,但如果显著水平为,双侧检验使用/2,单侧检验使用;同样的显著水平下,单侧检验更容易拒绝原假设,得出 自变量统计显著的结论。H0:j=0 H1:j0.05,接受原假设t(n-k-1)-t0.025t0.025p/20tp值0.05,接受原假设t(n-k-1)
6、t0.05p0tp值0若对于(H0:j=0 H1:j0),应如何计算?第21页,共50页,编辑于2022年,星期六将给定的显著性水平将给定的显著性水平 与与p值比较:值比较:若若p值值 ,则在显著性水平,则在显著性水平 下拒绝原假设下拒绝原假设若若p值值 ,则在显著性水平,则在显著性水平 下不能拒绝原假设下不能拒绝原假设这一准则对于所有的检验都适用这一准则对于所有的检验都适用第22页,共50页,编辑于2022年,星期六用语的提醒不能拒绝=接受?经济或实际显著性与统计显著性经济或实际显著性取决于参数估计值的大小(及符号)统计显著性取决于t统计量的值样本很大的情况下,标准差很小,此时容易出现统计显
7、 著而经济意义上不显著的情况使用较小的显著水平样本较小时,标准差较大,容易出现不显著的情况 使用较大的显著水平养老金计划的参与率 其他问题其他问题第23页,共50页,编辑于2022年,星期六培训津贴对企业废品率的影响hrsemp显著吗?需要多大的显著水平?第24页,共50页,编辑于2022年,星期六 多重共线性与统计显著性多重共线性与统计显著性回归参数估计量的方差变大回归参数估计量的方差变大多重共线性多重共线性使得使得t 统计量的值(统计量的值()变小)变小 接受接受H0:0(不显著)的概率增大(不显著)的概率增大 重要的解释变量被舍去,检验失去意义重要的解释变量被舍去,检验失去意义第25页,
8、共50页,编辑于2022年,星期六置信区间置信区间第26页,共50页,编辑于2022年,星期六由于:由于:由大括号内不等式表示置信水平为由大括号内不等式表示置信水平为1-时时 j的的置信区间:置信区间:得:得:P t/2 =1-t/2 0 t/2 第27页,共50页,编辑于2022年,星期六研发支出模型研发支出模型log(sales)系数的置信区间:第28页,共50页,编辑于2022年,星期六 案例案例案例案例1 1:规模报酬是不变的吗?:规模报酬是不变的吗?:规模报酬是不变的吗?:规模报酬是不变的吗?考虑柯布道格拉斯生产函数模型:Q=AKL对数化处理后,建立相应的计量模型为:ln Q=lnA
9、+lnK+lnL+u关于规模报酬不变的原假设可以表示为:H0:+=1 H1:+1 如何通过模型变换,利用如何通过模型变换,利用t检验对上述假设进行检验?检验对上述假设进行检验?检验关于参数的单个线性组合假设检验关于参数的单个线性组合假设第29页,共50页,编辑于2022年,星期六定义参数:原假设变换为:t统计量:其中 =+H0:=1 H1:1第30页,共50页,编辑于2022年,星期六能否直接将作为模型参数进行估计?原模型变换为:ln Q=lnA+lnK+(-)lnL+u 即:=+=-lnQ=lnA+ln(K/L)+lnL+u若定义参数:原假设变为标准的显著性检验:应如何对模型进行变换?=+-
10、1H0:=0 H1:1第31页,共50页,编辑于2022年,星期六任意关于参数单个线性单个线性组合的检验都可以同样处理!多受一年专科教育的回报比得上多一年本科教育吗?将“待检验的理论”转化为关于参数的假设:定义参数1=1-2,原假设为变换后的模型:ln(wage)=0+1 jc+2univ+3exper+uH0:1=2 H1:1 2H0:1=0 H1:1 0 ln(wage)=0+1 jc+2totcoll+3exper+utotcoll=jc+univ 案例案例案例案例2 2:专科和本科的教育回报相同吗?:专科和本科的教育回报相同吗?:专科和本科的教育回报相同吗?:专科和本科的教育回报相同吗
11、?第32页,共50页,编辑于2022年,星期六估计结果:5%显著水平下,能认为专科和本科的教育回报相同吗?若令2=2-1:原假设和备择假设是什么?给出变换后的模型形式。能直接给出模型的估计结果吗?结论会发生变化吗?第33页,共50页,编辑于2022年,星期六对于多元回归模型:y=0+1 x1+2 x2+k xk+u若自变量x1、x2、xk都无助于解释y,意味着什么?原假设和备择假设:如何检验?若原假设成立,SSE相对于SSR将很小?多个线性约束的检验:多个线性约束的检验:F检验检验 方程(回归整体)的显著性检验(方程(回归整体)的显著性检验(方程(回归整体)的显著性检验(方程(回归整体)的显著
12、性检验(P P143143)H0:1=2=k=0(或R2=0)H1:j(j=1,2,k)不全为零SST=SSE+SSR第34页,共50页,编辑于2022年,星期六计算F统计量:或者给定显著性水平,查找临界值进行判断:若:FF,拒绝原假设H0 认为至少有某些自变量能够解释y。第35页,共50页,编辑于2022年,星期六第36页,共50页,编辑于2022年,星期六 多重共线性的典型表现多重共线性的典型表现 当当模模型型的的拟拟合合优优度度(R2)很很高高,F值值很很高高,但但某某些些重重要要变变量量不不显显著著或或符符号号与与预预期期相相反反(方方差差很很大大,t值值很很低低),说说明明解解释释变
13、变量量间间可可能能存存在在多多重重共共线线性。性。例如:中国电信业务总量变化的影响因素是邮政业务总量、中国人口数、市镇人口占总人口的比重、人均GDP、全国居民人均消费水平。y=24.94+2.16 x1 3.03 x2+33.7 x3+1.29 x4-2.03 x5+et (0.7)(1.6)(-0.8)(1.0)(1.5)(-1.2)R2=0.99,F=106.3第37页,共50页,编辑于2022年,星期六棒球运动员薪水模型:若控制加入联盟的年份和每年参加比赛次数,运动员的 表现影响薪水吗?原假设和备择假设:排除性约束:若原假设为真,控制其他变量的情况下,其对被解释变 量没有影响,应该从模型
14、排除!一般的排除性约束检验一般的排除性约束检验一般的排除性约束检验一般的排除性约束检验 ln(salary)=0+1 years+2gamesyr+3bavg+4hrunsyr+5rbisyr+uH0:3=4=5=0 H1:3、4和 5不全为零第38页,共50页,编辑于2022年,星期六如何检验?不能通过单个系数的显著性检验实现!模型中某些变量不显著可能是多重共线性造成的,其中某个变量排除后,消除了共线性,其他不显著的变量可能会变得显著。第39页,共50页,编辑于2022年,星期六考虑两种模型:不受约束模型:受约束模型,即认为原假设成立原假设成立时的模型:若原假设真的成立,即 ,不受约束模 型
15、和受约束模型的估计结果应该差异不大,两者的残差平方和(SSR)应该比较接近若原假设不成立,受约束回归模型设定错误,两者的SSR差距较大受约束模型的残差平方(SSRr)和一定不小于不受约束 模型的残差平方和(SSRur),即 SSRr SSRur,为什么?ln(salary)=0+1 years+2gamesyr+3bavg+4hrunsyr+5rbisyr+u ln(salary)=0+1 years+2gamesyr+u 3=4=5=0 第40页,共50页,编辑于2022年,星期六一般情形:y=0+1 x1+2 x2+k xk+u原假设和备择假设:受约束模型:y=0+1 x1+2 x2+k-
16、q xk-q+uF统计量:H0:k-q+1=k=0 H1:j(j=k-q+1,k)不全为零分子自由度q:原假设中约束条件个数原假设中约束条件个数 分母自由度n-k-1:无约束模型的自由度无约束模型的自由度第41页,共50页,编辑于2022年,星期六F统计量的另一种形式给定显著性水平,查找临界值进行判断:若:FF,拒绝原假设H0 xk-q+1、xk是联合显著的。第42页,共50页,编辑于2022年,星期六 不受约束模型 受约束模型运动员的表现影响薪水吗?第43页,共50页,编辑于2022年,星期六F统计量和t统计量若原假设是单个参数约束,如 F检验和t检验的结论会一致吗?完全一致,因为:区别:t
17、检验可用于检验单侧单侧对立假设,F检验不行 对于单个参数约束,建议使用t检验l问题4.5(p143)H0:j=0 H1:j0 第44页,共50页,编辑于2022年,星期六对于模型:y=0+1 x1+2 x2+k xk+u原假设和备择假设:受约束模型:将约束条件施加到模型参数中不受约束模型:原始模型F统计量:H0:参数满足q个约束条件 H1:q个约束条件不全部成立 更一般的线性约束检验更一般的线性约束检验更一般的线性约束检验更一般的线性约束检验第45页,共50页,编辑于2022年,星期六住房价格的决定方程:若住房评估理性,则住房出售价格完全决定于其评估价 值,评估价值既定时,建筑面积、使用面积和
18、房间数应 该对住房价格没有影响。住房评估理性吗?原假设和备择假设:ln(price)=0+1 log(assess)+2log(lotsize)+3log(sqrft)+4bdrms+uH0:1=1,2=3=4=0 H1:约束条件不全成立第46页,共50页,编辑于2022年,星期六不受约束回归:受约束回归 如何回归?F统计量 ln(price)=0+log(assess)+u ln(price)=0+1 log(assess)+2log(lotsize)+3log(sqrft)+4bdrms+u规模报酬不变检验 ln Q=lnA+lnK+lnL+u原假设和备择假设:H0:+=1 H1:+1 受
19、约束回归的形式?第47页,共50页,编辑于2022年,星期六 p值=P(F F)F F检验的检验的检验的检验的P P值值值值F值p值将给定的显著性水平将给定的显著性水平 与与p值比较:值比较:若若p值值 ,则在显著性水平,则在显著性水平 下拒绝原假设下拒绝原假设若若p值值 ,则在显著性水平,则在显著性水平 下不能拒绝原假设下不能拒绝原假设第48页,共50页,编辑于2022年,星期六教师工资和福利间的替换关系报告回归结果报告回归结果 ln(总收入)=f(生产力因素,其他因素)ln(salary)+b/s=f(enroll,staff,droprate,gradrate)第49页,共50页,编辑于2022年,星期六 ln(salary)=0+1(b/s)+2ln(enroll)+5gradrate+u检验工资福利替代关系,即检验H0:j=-1 H1:j-1 第50页,共50页,编辑于2022年,星期六