《2022年显著性检验 .pdf》由会员分享,可在线阅读,更多相关《2022年显著性检验 .pdf(4页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、显著性检验T检验零假设,也称稻草人假设,如果零假设为真,就没有必要把X纳入模型,因此如果 X确定属于模型,则拒绝零假设Ho,接受备择假设 H1,(Ho:B2=0 H1:B20)假设检验的显著性检验法:t=(b2-B2)/Se(b2)服从自由度为(n-2)的 t 分布,如果令 Ho:B2=B2*,B2*是 B2的某个数值(若 B2*=0)则 t=(b2-B2*)/Se(b2)=(估计量假设值)/假设量的标准误。可计算出的 t 值作为检验统计量,它服从自由度为(n-2)的 t 分布,相应的检验过程称为t 检验。T检验时需知:,对于双变量模型,自由度为(n-2);,在检验分析中,常用的显著水平 有
2、1%,5%或 10%,为避免选择显著水平的随意性,通常求出 p 值,p 值充分小,拒绝零假设;可用半边或双边检验。双边 T 检验:若计算的 ItI超过临界 t 值,则拒绝零假设。显著性水平临界值 t 0.01 3.355 0.05 2.306 0.10 1.860 单边检验:用于 B2系数为正,假设为Ho:B20 显著性水平临界值 t 0.01 2.836 0.05 1.860 0.10 1.397 F检验(多变量)(联合检验)F=R2/(k-1)/(1-R2)(n-k)=ESS(k-1)/RSS(n-k).n为观察值的个数,k为包括截距在内的解释变量的个数,ESS(解释平方和)=yi2RSS
3、(残差平方和)=ei2TSS(总平方和)=yi2=ESS+RSS.判定系数 r2=ESS/TSS F与 R2同方向变动,当 R2=0(Y与解释变量 X不想关),F 为 0,R2值越大,F值也越大,当 R2取极限值 1 时,F 值趋于无穷大。F检验(用于度量总体回归直线的显著性)也可用于检验R2的显著性 R2是否显著不为 0,即检验零假设式(Ho:B2=B3=0)与检验零假设 R2为 0 是等价的。虚拟变量虚拟变量即定性变量,通常表明具备或不具备某种性质,虚拟变量用 D表示。方差分析模型:仅包含虚拟变量的回归模型。若:Yi=B1+B2Di+Ui,Di 1,女性;0,男性B2为差别截距系数,表示两
4、类截距值的差异,B2=E(Yi/Di=1)-E(Yi/Di=0)通常把取值为 0 的一类称为基准类、基础类、参照类、比较类,研究结论与基准类的选择没有关系。定型变量有 m种分类时,则需引入(m-1)个虚拟变量,否则会陷入虚拟变量陷阱即完全共线性或多重共线性。多重共线性例:收入变量(X2)完全线性相关,而R2(=r2)=1 名师资料总结-精品资料欢迎下载-名师精心整理-第 1 页,共 4 页 -解释变量之间完全线性相关或者完全多重共线性时,不可能获得所有参数的唯一估计值,因而不能根据样本进行任何统计推断。多重共线性产生的原因:1 经济变量变化趋势的同向性2 解释变量中含有之后变量多重共线性的理论
5、后果:,在近似共线性的情况下,OLS估计量仍是无偏的近似共线性并未破坏,OLS估计量的最小方差性即使在总体回归方程中变量 x 之间不是线性相关,但在某个样本中,x 变量之间可能线性相关。多重共线性的实际后果:OLS估计量的方差和标准误较大置信区间变宽t值不显著R2值较高 OLS的估计量及其标准误对数据的微小变化敏感,他们不稳定回归系数符号有误难以评估多个解释变量对回归平方和(ESS)或 R2的贡献异方差:(同)等方差:例如,对于不同的个人可支配收入,储蓄的方差保持不变异方差:例如,对于不同的个人可支配收入,储蓄的方差并不相等,它随着个人可支配收入增加而变大。异方差问题多存在于截面数据而非时间序
6、列数据。异方差的后果:OLS估计量仍是线性的 OLS估计量是无偏的 OLS估计量不再具有最小方差性,即不再是有效的,OLS估计量不再是最优线性无偏估计量 OLS估计量的方差通常是有偏的偏差的产生是由于2,即ei2(d?f不再是真实 2 的无偏估计量)建立在 t 分布和 F分布上的置信区间和假设检验是不可靠的自相关自相关:按时间(如时间序列数据)或者空间(如截面数据)排列的观察值之间的相关关系。自相关通常与时间序列数据有关自相关的产生原因:惯性模型设定误差蛛网现象数据处理自相关的后果:最小二乘估计量仍是线性的和无偏的最小二乘估计量不是有效的,OLS估计量并不是最优线性无偏估计量(BLUE)OLS
7、估计量的方差是有偏的通常所用的t 检验,F检验是不可靠的计算得到的误差方2=RSS/d?f 是真实的 2 的有偏估计量,并且很可能低估了真实的2通常计算的 R2不能测度真实的 R2通常计算的预测方差和标准误也是无效的。模型选择:(1)好的模型具有的性质:简约性;可识别性;拟合优度;理论一致性;(2)设定误差的类型:遗漏相关变量;包括不必要变量;采用错误的函数形式;度量误差(3)各种设定误差的后果:遗漏相关变量,过低拟合模型;包括不相关变量,过度拟合模型;度量误差:1、因变量中的度量误差,OLS估计量是无偏的,OLS估计量的方差也是无偏的。但是估计量的估计方差比没有度量误差时的大。因为应变量中的
8、误差加入到了误差项ui 中。2、解释变量中的度量误差,OLS估计量是有偏的,OLS估计量也是不一致的。即使样本容量足够大,OLS估计量仍然有偏二元线性回归模型过原点与不过原点的原因:(1)无截距模型是用原始的平方和以及交叉乘积,而有截距模型则使用了均值调整后的平方和以及交叉乘积。(2)无截距中 2 的自由度是(n-1)不是(n-2),(3)有截距中名师资料总结-精品资料欢迎下载-名师精心整理-第 2 页,共 4 页 -r2 计算公式通常假定了模型中存在截距项(4)有截距模型的残差平方和,ui=ei 总为零,无截距不一定为零填空题:(1)若 B2=0,则 b2/se(b2)=t;(2)若 B2=
9、0,则 t=b2/se(b2)(3)r2位于 0 与 1 之间,r 位于-1 到 1 之间;(4)TSS=RSS+ESS (5)TSS 的自由度=ESS 的自由度+RSS的自由度(5)称为估计量的标准差(6)在双对数模型中,斜率度量了弹性;(7)在线性-对数模型中,斜率度量了解释变量每百分比变动引起的被解释变量的变化量;(8)在对数-线性模型中,斜率度量了增长量;(9)Y对 X的弹性定义为 dY(X)/dX(Y)(10)价格弹性的定义为价格每变动1%所引起的需求量变动的百分比(11)需求成为富有弹性的,如果价格弹性的绝对值大于1;需求称为缺乏弹性的,如果价格弹性的绝对值小于1 (12)在接近多
10、重共线性的情况下,回归系数的标准误趋于大,t 值趋于小(13)在完全多重共线性的情况下,普通最小二乘估计量是没有定义的,其方差是没有定义的(14)在其他情况不变的情况下,VIF 越高,则普通最小二乘估计量的方差越高。多选ESS(解释平方和):估计的 Y 值围绕其均值的变异,也称回归平方和(由解释变量解释的部分)RSS(残差平方和),即 Y变异未被解释的部分模型设置的误差:遗漏相关变量,包括不必要变量,采用了错误的函数形式,度量误差评价模型的好坏:简约性,可识别性,拟合优度,理论一致性,预测能力一元线性回归的假设条件;1 平均干扰为 0,2随机干扰项等方差,3 随机干扰项不存在序列相关 4 干扰
11、项与解释变量无关判断2 随机误差项 ui 与残差项 ei 是一回事2 总体回归函数给出了与自变量每个相对应的应变量的值2 线性回归模型意味着模型变量是线性的2 在线性回归模型中,解释变量是因,应变量是果2 随机变量的条件均值与非条件均值是一回事2 式(2-2)中的回归系数 B是随机变量,但式(2-4)中的 b 是参数2 式(2-1)中的斜率 B2度量了 X的单位变动引起的Y的斜率3实践中双变量2 OLS 就是使误差1计算 ols 估量1 高斯-马尔柯夫定理2 在双变回模中,扰动项1 只有当 ui 服从正态分布1r2=ESS/TSS 2 给定显著水平 a与自由的2 相关系数 r 与 b 同号3
12、p 值和显著水平1 仅当非校正判定系数2 判定所以解释变量2 当 r2=1 1 当自由度120 1在模型 Yi=B1+B2 2估计的回归系数是统计显著2要计算 t 2 多元回归的总体显著性3 就估计和假设检验而言1 无论模型中包括多少个1 双对数模型1LIV 模型的斜率系数1 双对数模型的 r2 可以1 线性-对数模型的 R2 2 模型 A:LnY=2 在模型 Yi=2引入虚拟变量后 2 尽管存在完全1在高度多重共线性的情况下3如果辅名师资料总结-精品资料欢迎下载-名师精心整理-第 3 页,共 4 页 -助回归1较高的相关系数3如果分析的目的2在存在异方差的情况下1如果存在异方差2 在存在异方差的情况下,常用的 OLS 3 如果从 OLS回归中1 没有那种异方差2 当存在自相关1 在形式如的自回归1 德宾-沃森 D统计量2 消除自方差的一阶差分2 两个模型,一个名师资料总结-精品资料欢迎下载-名师精心整理-第 4 页,共 4 页 -