《多元线性回归分析 (3).ppt》由会员分享,可在线阅读,更多相关《多元线性回归分析 (3).ppt(47页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、多元线性回归分析现在学习的是第1页,共47页2 引言:税收收入问题研究目的:研究目的:研究影响中国税收收入的主要原因,分析中央和地研究影响中国税收收入的主要原因,分析中央和地方税收收方税收收入增长的数量规律,预测中国税收未来的增长趋势。入增长的数量规律,预测中国税收未来的增长趋势。样本区间:样本区间:1978-2007年全国税收收入年全国税收收入理论分析:理论分析:l为全面反映中国税收增长的全貌,选择包括中央和地方税收的为全面反映中国税收增长的全貌,选择包括中央和地方税收的“国家财政收入国家财政收入”中中“各项税收各项税收”(简称(简称“税收收入税收收入”)作为)作为被解释变量被解释变量;l影
2、响税收收入的因素很多,本例重点关注影响税收收入的因素很多,本例重点关注经济发展水平经济发展水平(X1)、公共财政需求(公共财政需求(X2)和和物价水平(物价水平(X3)等三个因等三个因素,将其它因素归到随机误差项。素,将其它因素归到随机误差项。现在学习的是第2页,共47页2023/4/12l解释变量:选择解释变量:选择国内生产总值(国内生产总值(GDP)代表经济发展代表经济发展水平,中央和地方水平,中央和地方“财政支出财政支出”代表公共财政需求,代表公共财政需求,商品零售价格指数商品零售价格指数代表物价水平。代表物价水平。l根据变量时间序列变化趋势和现有文献的研究,设定计量根据变量时间序列变化
3、趋势和现有文献的研究,设定计量经济模型为:经济模型为:问题:问题:l上述模型中的参数各是多少?模型可靠吗?上述模型中的参数各是多少?模型可靠吗?l如果模型可靠,若给定如果模型可靠,若给定2008年国内生产总值、财政支出和商品年国内生产总值、财政支出和商品零售价格指数水平,则同年税收收入是多少?零售价格指数水平,则同年税收收入是多少?现在学习的是第3页,共47页2023/4/13将该模型一般化,得到多元线性回归模型的一将该模型一般化,得到多元线性回归模型的一般形式:般形式:现在学习的是第4页,共47页2023/4/14第三章第三章 多元线性回归分析多元线性回归分析回归模型及古典假设回归模型的参数
4、估计回归模型的假设检验回归模型的预测现在学习的是第5页,共47页2023/4/15多元线性回归模型古典假设第一节 回归模型及古典假设现在学习的是第6页,共47页2023/4/16一、多元线性回归模型一元线性回归模型:讨论一个被解释变量和一个解释变量之间的线性关系多元线性回归模型:讨论一个被解释变量和多个解释变量之间的线性关系比如,描述产出与投入之间关系的CD生产函数:现在学习的是第7页,共47页2023/4/17l多元线性总体回归模型 多元线性总体回归方程现在学习的是第8页,共47页2023/4/18l多元线性样本回归模型 多元线性样本回归方程现在学习的是第9页,共47页2023/4/19l定
5、义现在学习的是第10页,共47页2023/4/110l则有,多元线性总体回归模型 多元线性总体回归方程 多元线性样本回归模型 多元线性样本回归方程现在学习的是第11页,共47页2023/4/111二、古典假设无设定偏误:模型被正确设定解释变量 是确定性变量解释变量之间互不相关(无多重共线性):各解释变量之间不存在线性关系现在学习的是第12页,共47页2023/4/112l随机误差项具有零均值xy现在学习的是第13页,共47页2023/4/113l随机误差项同方差,且无自相关l随机误差项与解释变量之间不相关l随机误差项服从零均值、同方差的正态分布现在学习的是第14页,共47页2023/4/114
6、对多元线性样本回归模型和多元线性样本回归方程主要讨论:估计回归系数估计随机扰动项的分布回归系数OLS的性质第二节 回归模型的参数估计现在学习的是第15页,共47页2023/4/115一、参数的OLS估计OLS估计的准则:残差平方和最小现在学习的是第16页,共47页2023/4/116l求Q的最小值,有现在学习的是第17页,共47页2023/4/117二、OLS估计的性质参数OLS估计量是样本的函数:样本不同,参数估计量不同,因而参数估计量是随机变量参数OLS估计量具有线性、无偏性和最小方差性(BLUE)现在学习的是第18页,共47页2023/4/118线性:参数估计量是被解释变量的函数无偏性:
7、参数估计量的均值等于总体参数(证明见P80)现在学习的是第19页,共47页2023/4/119最小方差性(证明见P101附录3.1)现在学习的是第20页,共47页2023/4/120l多元线性回归方程通过l被解释变量估计值的均值等于真实值的均值l残差与解释变量不相关l残差与被解释变量的估计值不相关现在学习的是第21页,共47页2023/4/121三、随机扰动项方差的估计随机扰动项方差的无偏估计现在学习的是第22页,共47页2023/4/122l参数估计量的方差估计式现在学习的是第23页,共47页2023/4/123第三节 回归模型的假设检验拟合优度检验方程显著性检验变量显著性检验现在学习的是第
8、24页,共47页2023/4/124一、拟合优度检验目的:检验模型对样本观测值的拟合程度指标:构造统计量(即样本的函数)决定系数 修正的决定系数现在学习的是第25页,共47页2023/4/125现在学习的是第26页,共47页2023/4/126现在学习的是第27页,共47页2023/4/127现在学习的是第28页,共47页2023/4/128二、方程显著性检验(F Test)目的:检验模型中被解释变量和解释变量之间的线性关系在总体上是否显著成立。检验方法:F检验、t检验、r检验现在学习的是第29页,共47页2023/4/129方差分析表则有离差来源离差来源 平方和平方和自由度自由度方差方差回归
9、ESSkESS/k残差RSSn-(k+1)RSS/n-(k+1)总离差TSSn-1现在学习的是第30页,共47页2023/4/130原因在于,Y的总体服从正态分布,则Y的一组样本的平方和服从卡方分布现在学习的是第31页,共47页2023/4/131检验原理:检验模型中被解释变量和解释变量之间的线性关系在总体上是否显著,即是检验总体回归方程中的参数是否显著不为零所以,提出假设检验的原假设为模型线性关系不成立,即现在学习的是第32页,共47页2023/4/132方法:根据变量的样本观测值和估计值,计算F统计量的值。判断准则:现在学习的是第33页,共47页2023/4/133拟合优度检验与方程显著性
10、检验的比较区别:拟合优度检验从已经得到估计的模型出发,检验它对样本观测值的拟合程度;方程显著性检验是从样本观测值出发,检验模型总体线性关系的显著性。联系:模型对样本观测值的拟合程度越高,模型总体线性关系的显著性越强。现在学习的是第34页,共47页2023/4/134三、变量显著性检验T Test目的:检验当其它解释变量不变时,每个解释变量对被解释变量的影响是否显著。方法:F检验、t检验、z检验现在学习的是第35页,共47页2023/4/135构造统计量检验原理:如果某个解释变量是显著的,则其对应的回归系数应该显著地不为零现在学习的是第36页,共47页2023/4/136所以,提出假设检验的原假
11、设为解释变量的系数为零,即方法:根据变量的样本观测值和估计值,计算t统计量的值。现在学习的是第37页,共47页2023/4/137判断准则现在学习的是第38页,共47页2023/4/138第四节 回归模型的预测参数估计量的置信区间预测值的置信区间现在学习的是第39页,共47页2023/4/139一、参数估计量的置信区间参数估计量是样本的函数:样本不同,则参数估计量不同以参数估计量的点估计值为中心构造一个区间(置信区间)问题:总体回归模型的相应参数以多大置信水平位于该置信区间?该置信区间多大?现在学习的是第40页,共47页2023/4/140变量的显著性检验中,有现在学习的是第41页,共47页二
12、、预测值的置信区间给定样本以外的解释变量的观测值则根据样本回归方程可得到被解释变量的预测值的估计值但得到的不是预测值,原因在于l模型中的参数估计量不确定l随机误差项的影响现在学习的是第42页,共47页2023/4/142需要以被解释变量预测值的估计值为中心构造一个区间(置信区间)问题:被解释变量预测值以多大置信水平位于该置信区间?该置信区间多大?现在学习的是第43页,共47页2023/4/143如果已经知道被解释变量实际的预测值,则预测误差为现在学习的是第44页,共47页2023/4/144现在学习的是第45页,共47页2023/4/14546 第五节 引言案例现在学习的是第46页,共47页2023/4/146现在学习的是第47页,共47页2023/4/147