《多元线性回归方法及其应用实例.ppt》由会员分享,可在线阅读,更多相关《多元线性回归方法及其应用实例.ppt(47页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、多元线性回归方法及其应用实例现在学习的是第1页,共47页主要内容n多元线性回归模型的一般形式 n参数估计(OLS估计)n假设检验n预测现在学习的是第2页,共47页一.多元线性回归模型n问题的提出n解析形式n矩阵形式现在学习的是第3页,共47页问题的提出n现实生活中引起被解释变量变化的因素并非仅只一个解释变量,可能有很多个解释变量。n例如,产出往往受各种投入要素资本、劳动、技术等的影响;销售额往往受价格和公司对广告费的投入的影响等。n所以在一元线性模型的基础上,提出多元线性模型解释变量个数 2现在学习的是第4页,共47页多元线性回归模型的假设n解释变量 Xi 是确定性变量,不是随机变量;解释变量
2、之间互不相关,即无多重共线性。n随机误差项具有0均值和同方差n随机误差项不存在序列相关关系n随机误差项与解释变量之间不相关n随机误差项服从0均值、同方差的正态分布现在学习的是第5页,共47页多元模型的解析表达式现在学习的是第6页,共47页多元模型的矩阵表达式现在学习的是第7页,共47页矩阵形式现在学习的是第8页,共47页二.参数估计(OLS)n参数值估计n参数估计量的性质n偏回归系数的含义n正规方程n样本容量问题现在学习的是第9页,共47页1.参数值估计(OLS)现在学习的是第10页,共47页得到下列方程组求参数估计值的实质是求一个k+1元方程组现在学习的是第11页,共47页正规方程正规方程变
3、成矩阵形式现在学习的是第12页,共47页正规方程正规方程矩阵形式现在学习的是第13页,共47页最小二乘法的矩阵表示现在学习的是第14页,共47页2.1最小二乘估计量的性质n(1)线性(估计量都是被解释变量观测值的线性组合)n(2)无偏性(估计量的数学期望=被估计的真值)n(3)有效性(估计量的方差是所有线性无偏估计中最小的)现在学习的是第15页,共47页OLS估计量的性质(续)现在学习的是第16页,共47页线性现在学习的是第17页,共47页无偏性现在学习的是第18页,共47页有效性现在学习的是第19页,共47页2.2 OLS回归线的性质n完全同一元情形:现在学习的是第20页,共47页2.3 随
4、机扰动项方差的估计现在学习的是第21页,共47页注解:k与k+1n凡是按解释变量的个数为k的,那么共有k+1个参数要估计。而按参数个数为k的,则实际有k-1个解释变量。总之两者相差1而已!要小心所用的k是什么意思!n所以如果本来是用解释变量个数的k表示的要转换成参数个数的k则用k-1代换原来的k就可以了!现在学习的是第22页,共47页3.偏回归系数的意义n多元回归模型中的回归系数称为偏回归系数n某解释变量前回归系数的含义是,在其他解释变量保持不变的条件下,该变量变化一个单位,被解释变量将平均发生偏回归系数大小的变动现在学习的是第23页,共47页4.正规方程n由最小二乘法得到的用以估计回归系数的
5、线性方程组,称为正规方程现在学习的是第24页,共47页正规方程的结构nY 被解释变量观测值 n x 1nX 解释变量观测值(含虚拟变量n x(k+1))nXX 设计矩阵(实对称(k+1)x(k+1)矩阵)nXY 正规方程右端 n x 1n 回归系数矩阵((k+1)x 1)n 高斯乘数矩阵,设计矩阵的逆n 残差向量(n x 1)n 被解释变量的拟合(预测)向量 n x 1现在学习的是第25页,共47页5.多元回归模型参数估计中的样本容量问题n样本是一个重要的实际问题,模型依赖于实际样本。n获取样本需要成本,企图通过样本容量的确定减轻收集数据的困难。n最小样本容量:满足基本要求的样本容量现在学习的
6、是第26页,共47页最小样本容量 n k+1n(XX)-1存在|XX|0 XX 为k+1阶的满秩阵nR(AB)min(R(A),R(B)nR(X)k+1n因此,必须有nk+1现在学习的是第27页,共47页满足基本要求的样本容量n一般经验认为:nn 30或者n 3(k+1)才能满足模型估计的基本要求。nn 3(k+1)时,t分布才稳定,检验才较为有效现在学习的是第28页,共47页第三节 多元线性回归模型的检验n本节主要介绍:n3.1 拟合优度检验(判定系数及其校正)n3.2 回归参数的显著性检验(t检验)n3.3 回归方程的显著性检验(F检验)n3.4 拟合优度、t检验、F检验的关系现在学习的是
7、第29页,共47页3.1.1 拟合优度检验 总平方和、自由度的分解n目的:构造一个不含单位,可以相互比较,而且能直观判断拟合优劣的指标。n类似于一元情形,先将多元线性回归作如下平方和分解:现在学习的是第30页,共47页对以上自由度的分解的说明现在学习的是第31页,共47页3.1.2 判定系数n判定系数的定义:n意义:判定系数越大,自变量对因变量的解释程度越高,自变量引起的变动占总变动的百分比高。观察点在回归直线附近越密集。n取值范围:0-1现在学习的是第32页,共47页3.1.3 校正判定系数n为什么要校正?n判定系数随解释变量个数的增加而增大。易造成错觉:要模型拟合得越好,就应增加解释变量。
8、然而增加解释变量会降低自由度,减少可用的样本数。并且有时增加解释变量是不必要的。n导致解释变量个数不同模型之间对比困难。n判定系数只涉及平方和,没有考虑自由度。n校正思路:引进自由度校正所计算的平方和。现在学习的是第33页,共47页校正判定系数 (续)现在学习的是第34页,共47页3.2 回归参数的显著性检验 t检验现在学习的是第35页,共47页以下给出t-检验的具体过程现在学习的是第36页,共47页3.3 回归方程的显著性检验 (F检验)n 回归系数的t检验,检验了各个解释变量Xj单独对应变量Y是否显著;我们还需要检验:所有解释变量联合在一起,是否对应变量Y也显著?n这即是下面所要进行的F-
9、检验。现在学习的是第37页,共47页3.3.1 方差分析表以下用表格的形式列出平方和、自由度、方差平方和来源平方和自由度均方和源于回归K-1源于残差n-k总平方和n-1现在学习的是第38页,共47页3.3.2 F检验(单侧检验)现在学习的是第39页,共47页3.4 各种检验之间的关系n3.4.1 经济意义检验和其他检验的关系联系:判断一个回归模型是否正确,首先要看模型是否具有合理的经济意义,其次才是统计检验。现在学习的是第40页,共47页3.4.2 拟合优度和F检验的关系(1)都是对回归方程的显著性检验;(2)都是把总平方和分解,以构成统计量进行检验;(3)两者同增同减,具有一致性。现在学习的
10、是第41页,共47页拟合优度和F检验的关系(续)n区别:(1)F检验中使用的统计量有精确的分布,而拟合优度检验没有;(2)对是否通过检验,判定系数(校正判定系数)只能给出一个模糊的推测;而F检验可以在给定显著水平下,给出统计上的严格结论;现在学习的是第42页,共47页3.4.2 F检验和t检验的关系n在一元的情形,两者是一致的,等价的。对单个解释变量显著性进行t检验,也就检验了解释变量的整体显著性(F检验);并且可以证明:Ft2(所以在一元情形,只需要进行一种检验)n多元中,不存在以上关系。现在学习的是第43页,共47页回归模型假设检验的步骤n查看拟合优度,进行F检验,从整体上判断回归方程是否成立,如果F检验通不过,无须进行下一步;否则进行下一步n查看各个变量的t值及其相应的概率,进行t检验,如果相应的概率小于给定的显著水平,该自变量的系数显著地不为0,该自变量对因变量作用显著;否则系数与0无显著差异(本质上=0),该自变量对因变量无显著的作用,应从方程中删去,重新估计方程。n但是,一次只能将最不显著(相应概率最大)的删除。每次删除一个,直至全部显著。现在学习的是第44页,共47页3.5多元线性回归模型的预测现在学习的是第45页,共47页举例:新股发行抑价的实证研究现在学习的是第46页,共47页现在学习的是第47页,共47页