《多元线性回归方法及其应用实例讲稿.ppt》由会员分享,可在线阅读,更多相关《多元线性回归方法及其应用实例讲稿.ppt(47页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、多元线性回归方法及其应用实例第一页,讲稿共四十七页哦主要内容n多元线性回归模型的一般形式 n参数估计(OLS估计)n假设检验n预测第二页,讲稿共四十七页哦一.多元线性回归模型n问题的提出n解析形式n矩阵形式第三页,讲稿共四十七页哦问题的提出n现实生活中引起被解释变量变化的因素并非仅只一个解释变量,可能有很多个解释变量。n例如,产出往往受各种投入要素资本、劳动、技术等的影响;销售额往往受价格和公司对广告费的投入的影响等。n所以在一元线性模型的基础上,提出多元线性模型解释变量个数 2第四页,讲稿共四十七页哦多元线性回归模型的假设n解释变量 Xi 是确定性变量,不是随机变量;解释变量之间互不相关,即
2、无多重共线性。n随机误差项具有0均值和同方差n随机误差项不存在序列相关关系n随机误差项与解释变量之间不相关n随机误差项服从0均值、同方差的正态分布第五页,讲稿共四十七页哦多元模型的解析表达式第六页,讲稿共四十七页哦多元模型的矩阵表达式第七页,讲稿共四十七页哦矩阵形式第八页,讲稿共四十七页哦二.参数估计(OLS)n参数值估计n参数估计量的性质n偏回归系数的含义n正规方程n样本容量问题第九页,讲稿共四十七页哦1.参数值估计(OLS)第十页,讲稿共四十七页哦得到下列方程组求参数估计值的实质是求一个k+1元方程组第十一页,讲稿共四十七页哦正规方程正规方程变成矩阵形式第十二页,讲稿共四十七页哦正规方程正
3、规方程矩阵形式第十三页,讲稿共四十七页哦最小二乘法的矩阵表示第十四页,讲稿共四十七页哦2.1最小二乘估计量的性质n(1)线性(估计量都是被解释变量观测值的线性组合)n(2)无偏性(估计量的数学期望=被估计的真值)n(3)有效性(估计量的方差是所有线性无偏估计中最小的)第十五页,讲稿共四十七页哦OLS估计量的性质(续)第十六页,讲稿共四十七页哦线性第十七页,讲稿共四十七页哦无偏性第十八页,讲稿共四十七页哦有效性第十九页,讲稿共四十七页哦2.2 OLS回归线的性质n完全同一元情形:第二十页,讲稿共四十七页哦2.3 随机扰动项方差的估计第二十一页,讲稿共四十七页哦注解:k与k+1n凡是按解释变量的个
4、数为k的,那么共有k+1个参数要估计。而按参数个数为k的,则实际有k-1个解释变量。总之两者相差1而已!要小心所用的k是什么意思!n所以如果本来是用解释变量个数的k表示的要转换成参数个数的k则用k-1代换原来的k就可以了!第二十二页,讲稿共四十七页哦3.偏回归系数的意义n多元回归模型中的回归系数称为偏回归系数n某解释变量前回归系数的含义是,在其他解释变量保持不变的条件下,该变量变化一个单位,被解释变量将平均发生偏回归系数大小的变动第二十三页,讲稿共四十七页哦4.正规方程n由最小二乘法得到的用以估计回归系数的线性方程组,称为正规方程第二十四页,讲稿共四十七页哦正规方程的结构nY 被解释变量观测值
5、 n x 1nX 解释变量观测值(含虚拟变量n x(k+1))nXX 设计矩阵(实对称(k+1)x(k+1)矩阵)nXY 正规方程右端 n x 1n 回归系数矩阵((k+1)x 1)n 高斯乘数矩阵,设计矩阵的逆n 残差向量(n x 1)n 被解释变量的拟合(预测)向量 n x 1第二十五页,讲稿共四十七页哦5.多元回归模型参数估计中的样本容量问题n样本是一个重要的实际问题,模型依赖于实际样本。n获取样本需要成本,企图通过样本容量的确定减轻收集数据的困难。n最小样本容量:满足基本要求的样本容量第二十六页,讲稿共四十七页哦最小样本容量 n k+1n(XX)-1存在|XX|0 XX 为k+1阶的满
6、秩阵nR(AB)min(R(A),R(B)nR(X)k+1n因此,必须有nk+1第二十七页,讲稿共四十七页哦满足基本要求的样本容量n一般经验认为:nn 30或者n 3(k+1)才能满足模型估计的基本要求。nn 3(k+1)时,t分布才稳定,检验才较为有效第二十八页,讲稿共四十七页哦第三节 多元线性回归模型的检验n本节主要介绍:n3.1 拟合优度检验(判定系数及其校正)n3.2 回归参数的显著性检验(t检验)n3.3 回归方程的显著性检验(F检验)n3.4 拟合优度、t检验、F检验的关系第二十九页,讲稿共四十七页哦3.1.1 拟合优度检验 总平方和、自由度的分解n目的:构造一个不含单位,可以相互
7、比较,而且能直观判断拟合优劣的指标。n类似于一元情形,先将多元线性回归作如下平方和分解:第三十页,讲稿共四十七页哦对以上自由度的分解的说明第三十一页,讲稿共四十七页哦3.1.2 判定系数n判定系数的定义:n意义:判定系数越大,自变量对因变量的解释程度越高,自变量引起的变动占总变动的百分比高。观察点在回归直线附近越密集。n取值范围:0-1第三十二页,讲稿共四十七页哦3.1.3 校正判定系数n为什么要校正?n判定系数随解释变量个数的增加而增大。易造成错觉:要模型拟合得越好,就应增加解释变量。然而增加解释变量会降低自由度,减少可用的样本数。并且有时增加解释变量是不必要的。n导致解释变量个数不同模型之
8、间对比困难。n判定系数只涉及平方和,没有考虑自由度。n校正思路:引进自由度校正所计算的平方和。第三十三页,讲稿共四十七页哦校正判定系数 (续)第三十四页,讲稿共四十七页哦3.2 回归参数的显著性检验 t检验第三十五页,讲稿共四十七页哦以下给出t-检验的具体过程第三十六页,讲稿共四十七页哦3.3 回归方程的显著性检验 (F检验)n 回归系数的t检验,检验了各个解释变量Xj单独对应变量Y是否显著;我们还需要检验:所有解释变量联合在一起,是否对应变量Y也显著?n这即是下面所要进行的F-检验。第三十七页,讲稿共四十七页哦3.3.1 方差分析表以下用表格的形式列出平方和、自由度、方差平方和来源平方和自由
9、度均方和源于回归K-1源于残差n-k总平方和n-1第三十八页,讲稿共四十七页哦3.3.2 F检验(单侧检验)第三十九页,讲稿共四十七页哦3.4 各种检验之间的关系n3.4.1 经济意义检验和其他检验的关系联系:判断一个回归模型是否正确,首先要看模型是否具有合理的经济意义,其次才是统计检验。第四十页,讲稿共四十七页哦3.4.2 拟合优度和F检验的关系(1)都是对回归方程的显著性检验;(2)都是把总平方和分解,以构成统计量进行检验;(3)两者同增同减,具有一致性。第四十一页,讲稿共四十七页哦拟合优度和F检验的关系(续)n区别:(1)F检验中使用的统计量有精确的分布,而拟合优度检验没有;(2)对是否
10、通过检验,判定系数(校正判定系数)只能给出一个模糊的推测;而F检验可以在给定显著水平下,给出统计上的严格结论;第四十二页,讲稿共四十七页哦3.4.2 F检验和t检验的关系n在一元的情形,两者是一致的,等价的。对单个解释变量显著性进行t检验,也就检验了解释变量的整体显著性(F检验);并且可以证明:Ft2(所以在一元情形,只需要进行一种检验)n多元中,不存在以上关系。第四十三页,讲稿共四十七页哦回归模型假设检验的步骤n查看拟合优度,进行F检验,从整体上判断回归方程是否成立,如果F检验通不过,无须进行下一步;否则进行下一步n查看各个变量的t值及其相应的概率,进行t检验,如果相应的概率小于给定的显著水平,该自变量的系数显著地不为0,该自变量对因变量作用显著;否则系数与0无显著差异(本质上=0),该自变量对因变量无显著的作用,应从方程中删去,重新估计方程。n但是,一次只能将最不显著(相应概率最大)的删除。每次删除一个,直至全部显著。第四十四页,讲稿共四十七页哦3.5多元线性回归模型的预测第四十五页,讲稿共四十七页哦举例:新股发行抑价的实证研究第四十六页,讲稿共四十七页哦第四十七页,讲稿共四十七页哦