ch07相关与回归分析.pptx

上传人:赵** 文档编号:82467149 上传时间:2023-03-25 格式:PPTX 页数:85 大小:504.56KB
返回 下载 相关 举报
ch07相关与回归分析.pptx_第1页
第1页 / 共85页
ch07相关与回归分析.pptx_第2页
第2页 / 共85页
点击查看更多>>
资源描述

《ch07相关与回归分析.pptx》由会员分享,可在线阅读,更多相关《ch07相关与回归分析.pptx(85页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、Ch7 相关与回归分析统计学原理统计学原理n7.1 相关与回归的基本概念n7.2 相关分析n7.3 一元线性回归分析n7.4 多元线性回归分析(new)n7.5 回归诊断与残差分析(new)ch07相关与回归分析共85页,您现在浏览的是第1页!主要介绍:相关分析,回归技术,回归诊断方法。Ch7 主要内容Ch7 相关与回归分析相关与回归分析7.1 相关与回归的基本概念相关与回归的基本概念7.2 相关分析相关分析7.3 一元线性回归分析一元线性回归分析7.4 多元线性回归分析多元线性回归分析(new)7.5 回归诊断与残差分析回归诊断与残差分析(new)ch07相关与回归分析共85页,您现在浏览的

2、是第2页!Ch7 学习目的学习目的1,掌握相关与回归的基本概念2,掌握相关分析技术3,掌握一元线性回归方法4,掌握多元线性回归方法5,掌握回归诊断方法Ch7 相关与回归分析相关与回归分析7.1 相关与回归的基本概念相关与回归的基本概念7.2 相关分析相关分析7.3 一元线性回归分析一元线性回归分析7.4 多元线性回归分析多元线性回归分析(new)7.5 回归诊断与残差分析回归诊断与残差分析(new)ch07相关与回归分析共85页,您现在浏览的是第3页!Ch7 相关与回归分析统计学原理统计学原理n7.1 相关与回归的基本概念n7.2 相关分析n7.3 一元线性回归分析n7.4 多元线性回归分析(

3、new)n7.5 回归诊断与残差分析(new)ch07相关与回归分析共85页,您现在浏览的是第4页!n关系给定一个X,就可以确定一个Y,Y值随X的值变化。Y(X=X t)是这两个变量之间的函数表达式。这个函数表达式,对应着一个具体的因果数学定理。特征是,“2个以上变量的变化方向大致是规则的”,变量Y,X之间的近似规则关系,只是一个经验关系是Y与(X=X t)的偏差,且总假定E()=0关系确定性关系相关关系经验关系Y (X=X t)+函数关系统计关系Y (X=X t)7.1.1 确定性关系与相关关系Ch7 相关与回归分析相关与回归分析7.1 相关与回归的基本概念相关与回归的基本概念ch07相关与

4、回归分析共85页,您现在浏览的是第5页!7.1.2 回归函数与经验方程n存在统计相关关系的变量Y,X之间,有nY(X=X t)+;(7.1.2)n因为,E()=0,所以,E(Y|X=X t)(X t)是给定X=X t条件下Y的期望值,(X t)就是Y关于X的期望函数。它实际反映的是Y,X之间存在的统计规律。n因为统计规律,总是可以在日常的实践过程中,不断回归重现。于是,期望函数,也称为Y关于X的回归方程或回归函数,记为n (X=X t)E(Y|X=X t)(7.1.3)n回归函数的具体表达式,通常也叫经验函数或者经验公式。Ch7 相关与回归分析相关与回归分析7.1 相关与回归的基本概念相关与回

5、归的基本概念返回ch07相关与回归分析共85页,您现在浏览的是第6页!7.1.4 相关表与相关图n相关表与相关图,是研究相关关系的直观工具。一般在进行详细的定量分析之前,可以先利用它们,对现象之间存在的相关方向、形式和密切程度,作大致的判断。n相关表,是一种反映变量之间相关关系的统计表。将某一变量,按其取值的大小顺序排列,然后再将与其相关的另一变量的值,对应排列,便可得到简单的相关表。n利用相关表,便可得到相关图。相关图又称散布图。它是以直角坐标系的横轴代表变量X,纵轴代表变量Y,将两个变量的值,用坐标点(Xt,Y t)的形式描绘出来,用来反映两变量之间相关关系的图形。Ch7 相关与回归分析相

6、关与回归分析7.1 相关与回归的基本概念相关与回归的基本概念ch07相关与回归分析共85页,您现在浏览的是第7页!7.1.5 相关关系的种类n按相关的程度可分为完全相关、不完全相关、不相关n按相关的方向可分为正相关、负相关n按相关的形式可分为线性相关和非线性相关n按所研究的变量的多少可分为单相关、复相关和偏相关Ch7 相关与回归分析相关与回归分析7.1 相关与回归的基本概念相关与回归的基本概念正线性相关正线性相关负线性相关负线性相关YX0YX=1+2X.0非线性相关非线性相关非线性相关非线性相关YX0YX图图72 线性相关与非线性相关线性相关与非线性相关0返回ch07相关与回归分析共85页,您

7、现在浏览的是第8页!7.2.1 相关系数n相关系数也叫单相关系数。n它是在线性相关的条件下,用来测定变量Y,X之间相关程度的一个重要指标。通常以表示总体的相关系数,以表示样本的相关系数。n存在线性相关的变量总体(Y,X),定义为n(7.2.1)n式中:Cov(X,Y)是变量X和Y的协方差,Var(X)和Var(Y)分别是X和Y的方差。n对来自总体(Y,X)的n组样本观察值(Y t,X t),t=1,2,3,n-1,n,记为n(7.2.2)n其中SX,Y=Cov(Xt,Yt)是样本(Y t,Xt)的协方差,SX和SY分别是X和Y 的样本标准差。样本相关系数,是根据样本观察值计算的。Ch7 相关与

8、回归分析相关与回归分析7.2 相关分析相关分析ch07相关与回归分析共85页,您现在浏览的是第9页!7.2.1 相关系数n【例7-2】利用某国1951-1970年的消费Y和可支配收入X数据,计算它们之间的相关系数。n解:根据相关系数的公式,有nn于是Ch7 相关与回归分析相关与回归分析7.2 相关分析相关分析年份序号t可支配收入Xt消费Yt19511226.6206.319522238.3216.719533252.623019544257.4236.519555275.3254.419566293.2266.719577308.5281.419588318.8290.119599337.33

9、11.2196010350325.2196111364.4335.2196212385.3355.1196313404.6375196414438.1401.2196515473.2432.8196616511.9466.3196717546.3492.1196818591.2535.8196919631.6577.5197020684.7616.8ch07相关与回归分析共85页,您现在浏览的是第10页!7.2.2 相关系数与相关程度n如果|=1,表明(Y,X)之间是完全线性相关,完全线性相关,是一种精确的线性函数关系;n如果|=0,表明(Y,X)之间没有关系或者线性无关;n如果0|1,(Y,

10、X)是一种线性统计关系,线性统计关系,是最常见的相关关系;01是正的线性相关;-10是负的线性相关。n|值越大,则线性关比较系密切,反之,则线性关系不密切。n同理,|=1,表示样本(Y t,X t)为完全线性相关;=1,表示(Y t,X t)为完全正线性相关,样本的所有点(Y t,X t)都在一条直线上;=-1,表示(Y t,X t)为完全负线性相关,样本的所有点(Y t,X t)也都在一条直线上;n=0,表示样本点(Y t,X t)在散点图上的分布是杂乱无章的,(Y t,X t)之间无相关关系;n0|t/2,拒绝H0,表示Y,X之间相关显著。Ch7 相关与回归分析相关与回归分析7.2 相关分

11、析相关分析ch07相关与回归分析共85页,您现在浏览的是第12页!7.2.3 相关系数的检验n的查表检验n的查表检验,是t检验或者F检验方法衍生的结果。不论是t检验还是F检验,其临界值t/2、F/2,对自由度n-2(样本容量=n)和样本相关系数,都有一个临界要求,反算出样本相关系数临界值/2,那么由显著性水平、自由度n-2及临界样本相关系数/2,就可以构成一个相关系数检验表。在给定条件下查验该表,就可以判断变量Y,X之间是否线性相关。n作统计假设nH0:=0,H1:0。n计算样本相关系数。n选择显著性水平,取=1%或者=5%。根据和自由度n-2,查相关系数表求临界值/2,若|/2,接受H0,表

12、示Y,X之间相关不显著;若|/2,拒绝H0,表示Y,X之间相关显著。Ch7 相关与回归分析相关与回归分析7.2 相关分析相关分析ch07相关与回归分析共85页,您现在浏览的是第13页!7.2.4 等级相关系数及其检验n等级相关系数(又称为顺序相关系数)。n设有Xt和Yt两个数列,依数量的大小或者品质的优劣,分为1,2,3,n-1,n个等级,以VX,t表示各个Xt的等级数,以VY,t表示各个Yt的等级数,则等级相关系数s为n(7.2.6)n式中,n是样本容量。n该公式可由两个等级变量的相关系数,推导而来。n与相关系数类似,s的取值范围为0|s|1。s为正值,存在正的等级相关关系,s取负值,存在负

13、的等级相关。s=1,表明两种现象的等级完全相同,存在完全正相关;s=-1,表明两种现象的等级完全相反,存在完全负相关。Ch7 相关与回归分析相关与回归分析7.2 相关分析相关分析非参数相关分析。多做定性研究。ch07相关与回归分析共85页,您现在浏览的是第14页!7.2.4 等级相关系数及其检验n【例7-4】某校对学生某专业课程的复习时间和考试成绩进行调查。抽查10同学的有关数据如下表。计算复习时间与考试成绩的相关系数和等级相关系数。根据以上结果,能否得出复习时间越长考试成绩越高的结论。n解:Ch7 相关与回归分析相关与回归分析7.2 相关分析相关分析序号t 复习时间 考试成绩 Dt2=(VX

14、,t-VX,t)2 时间Xt 排队等级VX,t 成绩Yt 排队等级VX,t 133863024487403114104228520555936168691517108958.5 0.25 89794709119958.5 0.25 10131096100合计-55-552.5 ch07相关与回归分析共85页,您现在浏览的是第15页!7.3 一元线性回归分析n7.3.1 标准的一元线性回归模型n7.3.2 一元线性回归模型的估计n7.3.3 一元线性回归模型的检验n7.3.4 误差项t的自相关检验 n7.3.5 一元线性回归模型的预测Ch7 相关与回归分析相关与回归分析7.1 相关与回归的基本概

15、念相关与回归的基本概念7.2 相关分析相关分析7.3 一元线性回归分析一元线性回归分析7.4 多元线性回归分析多元线性回归分析(new)7.5 回归诊断与残差分析回归诊断与残差分析(new)返回ch07相关与回归分析共85页,您现在浏览的是第16页!7.3.1 标准的一元线性回归模型n误差项的标准假定n误差项的期望值恒为零,即nE(tXt)=0(7.3.5)n误差项的方差是同观察时点t无关的常数,即nVar(tXt)=E(t2Xt)=2(7.3.6)n时点不同的误差项之间不相关,即nCov(t,s)=E(ts)=0;ts(7.3.7)nt的概率分布与1,2和X无关。nX是给定的变量(确定变量)

16、,即X,不是有统计从属关系的随机变量。nCov(Xt,t)=E(Xtt)=0(7.3.8)nt服从正态分布,即nt N(0,2)(7.3.9)n以上假定最早是由德国数学家高斯提出来的,也称为高斯假定或者标准假定。Ch7 相关与回归分析相关与回归分析7.3 一元线性回归分析一元线性回归分析图图73 总体回归与随机误差总体回归与随机误差YX=1+2X.0Y=1+2X+u u tch07相关与回归分析共85页,您现在浏览的是第17页!7.3.1 标准的一元线性回归模型n样本回归函数,就是根据样本资料(Yt,X t),对总体回归函数进行拟合的估计函数。由于样本(Yt,X t)来源于总体(Y,X),因此

17、,样本回归线与总体回归线,有相同的函数形式。由样本关系方程n(7.3.11)n有样本回归函数n(7.3.12)n式中,Yt和X t分别是Y和X的第t次观察值;t为样本回归线上与X t相对应的值,它是对E(YtX t)的估计;为样本回归系数,是对总体回归系数的1,2的估计;t=Ytt是实际观察值与样本估计值之差,亦称残差,是一个可计算的量;n为样本容量;是对2的估计。n样本回归函数是总体回归函数的近似反映。n回归分析的主要任务,就是充分利用样本的信息,采用适当的方法,使得样本回归函数,尽可能接近真实的总体回归函数。Ch7 相关与回归分析相关与回归分析7.3 一元线性回归分析一元线性回归分析返回c

18、h07相关与回归分析共85页,您现在浏览的是第18页!7.3.2 一元线性回归模型的估计n回归系数的估计(续)n求解正规方程组,得n(7.3.18)n利用(7.2.3)式,则最小二乘估计量,又可简写为n(7.3.19)Ch7 相关与回归分析相关与回归分析7.3 一元线性回归分析一元线性回归分析ch07相关与回归分析共85页,您现在浏览的是第19页!年份序号t可支配收入Xt消费YtXtXtYtYtXtYtX,tt=Ytt19511226.6206.351347.5642559.6946747.58209.1821-2.88214653819522238.3216.756786.8946958.8

19、951639.61219.7159-3.01593491319533252.623063806.765290058098232.5906-2.59056514819544257.4236.566254.7655932.2560875.1236.9121-0.41211935319555275.3254.475790.0964719.3670036.32253.02791.37208475719566293.2266.785966.2471128.8978196.44269.1437-2.44371113219577308.5281.495172.2579185.9686811.9282.918

20、7-1.5186651619588318.8290.1101633.484158.0192483.88292.192-2.09200022519599337.3311.2113771.396845.44104967.8308.8482.35200961196010350325.2122500105755113820320.28214.917897442196111364.4335.2132787.4112359122146.9333.24681.953234828196212385.3355.1148456.1126096136820352.06353.03646756196313404.63

21、75163701.2140625151725369.43985.560218361196414438.1401.2191931.6160961.4175765.7399.60061.599371305196515473.2432.8223918.2187315.8204801431.2021.598006182196616511.9466.3262041.6217435.7238699466.04450.255475404196717546.3492.1298443.7242162.4268834.2497.0157-4.915663065196818591.2535.8349517.4287

22、081.6316765537.4402-1.640201357196919631.6577.5398918.6333506.3364749573.81333.686717418197020684.7616.8468814.1380442.2422323621.6205-4.820475975合计2107889.37206.33471559288812931663057206.38.52651E-13平均10.5394.465360.315173578144406.5158315.3360.3154.26326E-14ch07相关与回归分析共85页,您现在浏览的是第20页!7.3.2 一元线性回

23、归模型的估计n随机误差项的方差估计n数学上可以证明,2的无偏估计S2可由下式给出:n(7.3.23)n在一元线性回归模型中,残差t必须满足1,2最小二乘估计要求所导出的两个约束条件:n(7.3.24)n因而失去了2个自由度,所以,残差t的自由度为n-2。nS越小,表明实际观测点与所拟的样本回归线的离差程度越小,即回归线具有较强的代表性;反之,S越大,表明实际观测点与所拟合的样本回归的离差程度越大,即回归线的代表性较差。因此,S又叫做回归估计的标准误差。Ch7 相关与回归分析相关与回归分析7.3 一元线性回归分析一元线性回归分析ch07相关与回归分析共85页,您现在浏览的是第21页!7.3.3

24、一元线性回归模型的检验n回归模型检验的种类n包括理论意义检验、一级检验和二级检验。n理论意义检验,主要涉及参数估计值的符号和取值区间,如果它们与实质性科学的理论及其人们的经验不相符,就说明模型不能很好地解释现实的现象。n一级检验,又称为统计学检验,它是利用统计学的抽样理论,来检验回归方程的可靠性,具体可分为拟合程度评价和显著性检验。一级检验,是所有回归分析必须通过的检验。n二级检验,又称为经济计量学检验,它是对标准线性回归模型中的高斯假定条件能否满足,进行检验,具体包括序列相关、异方差性检验等。Ch7 相关与回归分析相关与回归分析7.3 一元线性回归分析一元线性回归分析ch07相关与回归分析共

25、85页,您现在浏览的是第22页!7.3.3 一元线性回归模型的检验n可决系数2,是对回归模型拟合程度的综合度量指标,2越大,模型拟合程度越高;2越小,模型拟合程度越差。可决系数2具有如下性质:n021;当样本观察值(Yt,X t)都处于回归直线上时,SSE=0,2=1;当观察值(Yt,X t)并不全部处于回归直线上时,SSE0,021;当模型中解释变量X与因变量Y完全无关时,LYY=SSE,2=0。n2是样本观察值(Yt,X t)的函数,它也是一统计量;n2的开平方根为样本相关系数。可决系数开平方根后的符号,由回归变差LXY决定,它们两者同号。n注意:虽然2给出了一个回归的好坏、适与不适的程度

26、,但不能说只有2=0时才表明X完全不能解释Y。因为,即使总体相关系数=0,样本相关系数也不会正好是0。所以,一个更根本的问题是:0是否表示X和Y真正相关0?回答这个问题的统计方法是问:2或是否显著地异于0?这就需要进行显著性检验。Ch7 相关与回归分析相关与回归分析7.3 一元线性回归分析一元线性回归分析ch07相关与回归分析共85页,您现在浏览的是第23页!7.3.3 一元线性回归模型的检验n因为均为线性估计量,是因变量Yt的线性组合,根据高斯假定,可知Yt是服从正态分布的变量,所以也服从正态分布。有n(7.3.34)n其中n在总体方差2已知的情况下,可利用Z检验方法,对回归系数进行假设检验

27、。但一般来说,2是未知的,需要用其无偏估计量S2去代替。用代表的估计值,数学上可以证明,当样本为小样本时,有n(7.3.35)n利用以上结论,就可以对回归系数进行显著性检验。1,2的检验方法是相同的,但2的检验更为重要,因为它表明自变量X对因变量Y线性影响的程度。Ch7 相关与回归分析相关与回归分析7.3 一元线性回归分析一元线性回归分析ch07相关与回归分析共85页,您现在浏览的是第24页!7.3.4 误差项t的自相关检验 n自相关或称序列相关:n如果误差项之间存在相关关系,nCov(t,s)=E(ts)0;ts;ts(7.3.37)n则称这种现象为误差项t的自相关或称序列相关。n如果进一步

28、有nt=et-1+t;t N(0,2);且E(t s)=0;ts;ts。(7.3.38)n其中-1eF/2,拒绝零假设H0,表示自变量与因变量的线性关系显著。Ch7 相关与回归分析相关与回归分析7.4 多元线性回归分析多元线性回归分析(new)方差来源自由度平方和均方差F统计量回归p-1SSR=XYSSR/(p-1)(SSR/(p-1)/(SSE/(n-p)残差n-pSSE=eeS2=SSE/(n-p)总和n-1LYY=SSR+SSE,Y Y=XY+ee返回ch07相关与回归分析共85页,您现在浏览的是第36页!7.4.4 多元线性回归模型的预测nY0的区间估计:n由(7.4.27)、(7.4

29、.28)式可知,在高斯假定条件下,e0服从于标准正态分布,即ne0 N(0,Var(e0)(7.4.29)n由于Var(e0)中的2是未知的,通常用其无偏估计量S2来代替。用Se0来表示预测的标准误差的估计值,n(7.4.30)n数学上可以证明n(Y0-0)/Se0 t(n-p)(7.4.31)n对于给定的置信度为1-,有nPro0-t/2(n-p)Se0 Y0 0+t/2(n-p)Se0=1-,(7.4.32)n于是可以得出Y0的1-的置信区间为n 0-t/2(n-p)Se0 Y0 0+t/2(n-p)Se0,(7.4.33)n式中,t/2(n-p)是置信度为1-、自由度为n-p的t分布的临

30、界值。该区间以0为中点,长度为2t/2(n-2)Se0。中点0随X0线性地变化。因此,置信区间的上、下限曲线对称地落在回归向量平面两侧,而呈喇叭型。Ch7 相关与回归分析相关与回归分析7.4 多元线性回归分析多元线性回归分析(new)返回ch07相关与回归分析共85页,您现在浏览的是第37页!7.5.1 残差分析n即使方程通过了相关系数或F检验,也不能排除数据的异常值和周期性因素干扰问题。这些问题的严重后果是,所有建立在高斯假定基础上的OLSE,可能是一个毫无意义的估计。因为它不仅没有反映现象的现实,相反还夸大了方程估计的可靠性。n如何判断数据中有异常值和周期性因素干扰呢?n残差分析是一个有力

31、的工具。它的具体做法是,编制残差序列图,进行符号检验及序列相关检验,分析和猜测误差的来源,设法改进及剔除之,缩小误差,建立新的稳妥模型。残差分析也叫回归诊断。它是经济计量学检验的一部分。n检查是否有异常数据。n检查数据是否有周期性变化和倾向性变化。n检查回归模型是否合适。n异方差性的检验。n误差项t的序列相关检验。Ch7 相关与回归分析相关与回归分析7.5 回归诊断与残差分析回归诊断与残差分析(new)ch07相关与回归分析共85页,您现在浏览的是第38页!7.5.1 残差分析n残差分析Ch7 相关与回归分析相关与回归分析7.5 回归诊断与残差分析回归诊断与残差分析(new)图图78 残差分析

32、残差分析异方差存在的证据异方差存在的证据0Y0t2t模型选择不当模型选择不当Xt残差的非随机变动残差的非随机变动00ttt置信带内的残差分布置信带内的残差分布+t/2(n-p)S-t/2(n-p)Sch07相关与回归分析共85页,您现在浏览的是第39页!7.5.1 残差分析n检查回归模型是否合适。n记e=Y,由(7.4.3)式,如果X和Y之间有线性关系,则nY=X+u;u N(0,2I)(7.5.3)n=X =X(XX)-1XY=HY (7.5.4)n其中H=X(XX)-1X,于是有ne=Y=(IH)Y=(IH)u,(7.5.5)n此处应用了(IH)X=0,则有nE(e)=0,Cov(e,e)

33、=2(IH),Cov(,e)=0,(7.5.6)n如果X和Y之间有非线性关系,则有nCov(,e)0,(7.5.7)ne与相关。编制以t=Yt t作为纵坐标、以t为横坐标的残差图并观察之。如果残差图出现一段全为负(或正),紧接着一段全为正(或负),然后又接着一段全为负(或正)的现象;则说明回归模型选择不当,应改用非线性模型去拟合它。Ch7 相关与回归分析相关与回归分析7.5 回归诊断与残差分析回归诊断与残差分析(new)ch07相关与回归分析共85页,您现在浏览的是第40页!7.5.2 异方差性的补救措施 n异方差性并不破坏OLSE的无偏性和一致性,但估计不是有效的或者渐近有效的。由于缺乏有效

34、性,使得通常的假设检验不太可靠。补救的方法分为两类:n当E(u2)=2a2(t)为已知时,设异方差线性回归模型为nY=X +u,E(u2)=2a2(t)=2 t(7.5.10)n由于E(u2)=2 t已知,用t去除(7.5.10)式的两端,有n(7.5.11)n在这个新的模型中,误差项u/t满足高斯假定,因此可利用OLSE对去进行有效估计。n如果E(u2)=2a2(t)=2t为未知时,可对2 t进行一些合理的假定,将原来的模型变换成能满足同方差性假定的模型。通常的做法是设nE(u2)=2 t=2XI (7.5.12)n或者E(u2)=2 t=2XXI (7.5.13)n或者E(u2)=2 t=

35、2E(Y)=2(X)(7.5.14)n用t去除(7.5.10)式的两端,也可以得(7.5.11)式,再利用OLSE,可求得的有效估计。n在2 t为未知时的另一种做法是,不对Y=X +u进行估计,而对nlnY=lnX+u (7.5.15)n进行回归。这种方法叫对数变换。对数变换可以降低异方差性的程度。Ch7 相关与回归分析相关与回归分析7.5 回归诊断与残差分析回归诊断与残差分析(new)返回ch07相关与回归分析共85页,您现在浏览的是第41页!7.5.3 序列相关的补救措施 n序列相关的结构为已知时:如设序列相关的结构为(7.5.9)式,且e为已知。n因为在时间t内可以有Yt=Xt+ut (

36、7.5.16)n于是在时间t-1内也有Yt-1=Xt-1+ut-1 (7.5.17)n用e去乘(7.5.17)式的两端,有neYt-1=eXt-1+eut-1 (7.5.18)n(7.5.16)式减(7.5.18)式,有nYt-eYt-1=(Xt-eXt-1)+t (7.5.20)n由于t满足OLSE假定,所以可用OLSE方法对(7.5.20)式进行估计。回归方程(7.5.20)式称为广义差分方程。它是一个差分形式的Y对X的回归。特别地,如果e=1,可得到一阶差分算子方程nYt-Yt-1=(Xt-Xt-1)+t Yt=Xt+t (7.5.21)n如果e=-1,则得到2期移动平均回归模型nYt+

37、Yt-1=(Xt+Xt-1)+t (7.5.22)n即n(7.5.23)n它是一个移动平均数对另一个移动平均数的回归。Ch7 相关与回归分析相关与回归分析7.5 回归诊断与残差分析回归诊断与残差分析(new)ch07相关与回归分析共85页,您现在浏览的是第42页!7.5.3 序列相关的补救措施 n【例7-8】利用例7-6、例7-7的有关数据,试消除,消费与可支配收入之间,可能存在的自相关。n解:利用例7-6的结果,得回归估计方程的所有估计参数nX=5.168775+0.900324X,S=3.174108481,2=0.9993781n(2.205544043)(0.005293811)d=1

38、.225513n利用例7-7的D-W统计检验结果,知在=5%显著水平上,还不能做出是否存在显著自相关的决定。虽然,显著自相关的存在性不能确定,但自相关存在的可能性还是有的。利用d和e的近似关系,得n因此,必须设法消除之。n做Y*t=Yt-eeYt-1和X*t=Xt-eeXt-1变换,做nYt-eYt-1=(1-e)1+(Xt-eXt-1)2+tn的OLSE回归,求得广义差分方程nYt-eYt-1=4.636258855(1-e)+0.894803994(Xt-eXt-1),n(2.155056645)(0.00797102)nS=2.973263,2=0.99865279,d=1.883341

39、n其中LXX=139135.7445,(X)=4872.764,(X)/n=256.4613。nt(2)=0.894803994/0.00797102=112.2571274,t和2,均可以满足广义差分模型的检验。又从d=1.883341知道,在=5%显著水平上,dU/2=1.41,4-dU/2=2.59,dU/2d4-dU/2,可以接受无自相关的假设。Ch7 相关与回归分析相关与回归分析7.5 回归诊断与残差分析回归诊断与残差分析(new)返回ch07相关与回归分析共85页,您现在浏览的是第43页!Ch8 统计指数 介绍统计指数的作用,指数基本理论,与基本编制方法。下一章下一章Ch7 相关与

40、回归分析相关与回归分析7.1 相关与回归的基本概念相关与回归的基本概念7.2 相关分析相关分析7.3 一元线性回归分析一元线性回归分析7.4 多元线性回归分析多元线性回归分析(new)7.5 回归诊断与残差分析回归诊断与残差分析(new)ch07相关与回归分析共85页,您现在浏览的是第44页!7.1 相关与回归的基本概念n7.1.1 确定性关系与相关关系n7.1.2 回归函数与经验方程n7.1.3 相关与回归分析n7.1.4 相关表与相关图n7.1.5 相关关系的种类Ch7 相关与回归分析相关与回归分析7.1 相关与回归的基本概念相关与回归的基本概念7.2 相关分析相关分析7.3 一元线性回归

41、分析一元线性回归分析7.4 多元线性回归分析多元线性回归分析(new)7.5 回归诊断与残差分析回归诊断与残差分析(new)返回ch07相关与回归分析共85页,您现在浏览的是第45页!7.1.1 确定性关系与相关关系n确定性关系也叫函数关系。n Y(X=X t),(7.1.1)n即只要给定一个X,就可以确定一个Y,Y值随X的值变化,则变量Y,X之间,就是一种确定性的函数关系。Y(X=X t)是这两个变量之间的函数表达式。这个函数表达式,对应着一个具体的因果数学定理。nn相关关系也叫统计关系或者经验关系。n相关关系的特征是,“2个以上变量的变化方向大致是规则的”,n变量Y,X之间的某种近似规则关

42、系,不是一种精确的确定性关系,只是一个经验关系n Y(X=X t)+;(7.1.2)n是Y与(X=X t)的偏差,且总假定E()=0。n这种经验关系就是统计相关关系。n统计相关关系,常常表现为一种统计定律。统计定律和相关关系,是相关回归分析的主要研究对象。Ch7 相关与回归分析相关与回归分析7.1 相关与回归的基本概念相关与回归的基本概念返回ch07相关与回归分析共85页,您现在浏览的是第46页!7.1.3 相关与回归分析n相关与回归分析:n是研究相关关系的一种有力数学工具。它是建立在对客观事物进行大量试验和观察的基础上,在不确定的现象中,寻找隐藏的统计规律性的数理统计方法。具体步骤是:n步,

43、根据研究的目的,通过观察和实验取得资料。n第二步,整理资料。分组编制相关表,以便进行分析。n第三步,绘制相关图。把成对的相关资料,绘成散布图或曲线图,从图形中,初步判断变量之间是否存在相关关系,以及相关的基本形式。n第四步,相关关系的解析。建立回归方程,计算估计标准误差、相关系数等,以反映变量之间的关系、误差大小及密切程度,并运用数理统计方法,进行检验和评价。Ch7 相关与回归分析相关与回归分析7.1 相关与回归的基本概念相关与回归的基本概念返回ch07相关与回归分析共85页,您现在浏览的是第47页!7.1.4 相关表与相关图n【例7-1】利用某国1951-1970年的消费Y和可支配收入X数据

44、,可整理得相关表与相关图。Ch7 相关与回归分析相关与回归分析7.1 相关与回归的基本概念相关与回归的基本概念年份序号t可支配收入Xt消费Yt19511226.6206.319522238.3216.719533252.623019544257.4236.519555275.3254.419566293.2266.719577308.5281.419588318.8290.119599337.3311.2196010350325.2196111364.4335.2196212385.3355.1196313404.6375196414438.1401.2196515473.2432.81966

45、16511.9466.3196717546.3492.1196818591.2535.8196919631.6577.5197020684.7616.8图图71 消费消费Y 和可支配收入和可支配收入X相关图相关图YX0200200600400400600返回ch07相关与回归分析共85页,您现在浏览的是第48页!7.2 相关分析n7.2.1 相关系数n7.2.2 相关系数与相关程度n7.2.3 相关系数的检验n7.2.4 等级相关系数及其检验Ch7 相关与回归分析相关与回归分析7.1 相关与回归的基本概念相关与回归的基本概念7.2 相关分析相关分析7.3 一元线性回归分析一元线性回归分析7.4

46、 多元线性回归分析多元线性回归分析(new)7.5 回归诊断与残差分析回归诊断与残差分析(new)返回ch07相关与回归分析共85页,您现在浏览的是第49页!7.2.1 相关系数n总体值为常数,在很多情况下,是无法直接按定义计算的,只能通过样本相关系数,去估计值。n容易证明,样本相关系数,是总体相关系数的一致估计量。n可以证明,存在线性相关的变量之间,不论是总体相关系数,还是样本相关系数,均有0|1,0|1。n为便于计算,引进如下符号:nn(7.2.3)Ch7 相关与回归分析相关与回归分析7.2 相关分析相关分析ch07相关与回归分析共85页,您现在浏览的是第50页!年份序号t可支配收入Xt消

47、费YtXtXtYtYtXtYt19511226.6206.351347.5642559.6946747.5819522238.3216.756786.8946958.8951639.6119533252.623063806.76529005809819544257.4236.566254.7655932.2560875.119555275.3254.475790.0964719.3670036.3219566293.2266.785966.2471128.8978196.4419577308.5281.495172.2579185.9686811.919588318.8290.1101633.

48、484158.0192483.8819599337.3311.2113771.396845.44104967.8196010350325.2122500105755113820196111364.4335.2132787.4112359122146.9196212385.3355.1148456.1126096136820196313404.6375163701.2140625151725196414438.1401.2191931.6160961.4175765.7196515473.2432.8223918.2187315.8204801196616511.9466.3262041.621

49、7435.7238699196717546.3492.1298443.7242162.4268834.2196818591.2535.8349517.4287081.6316765196919631.6577.5398918.6333506.3364749197020684.7616.8468814.1380442.2422323合计-7889.37206.3347155928881293166305平均-394.465360.315173578144406.5158315.3返回ch07相关与回归分析共85页,您现在浏览的是第51页!7.2.3 相关系数的检验n检验样本相关系数,实质上是用样

50、本相关系数,检验总体相关系数是否为0,如果=0,则两变量Y,X之间,线性关系微弱;若0,则两变量Y,X之间,线性关系显著。n由的分布理论,可以证明:如果变量Y,X是正态变量,当=0,则与有关的统计量n(7.2.4)n与有关的统计量n(7.2.5)n根据这一定理,可以检验是否为0(总体两变量之间直线相关关系是否为不显著)。各种不同的统计量,构成不同的检验方法。因此,的检验方法,有t统计量检验、F统计量检验和的查表检验。的查表检验,是t检验或者F检验方法的结果。三种方法的检验结论相同。Ch7 相关与回归分析相关与回归分析7.2 相关分析相关分析ch07相关与回归分析共85页,您现在浏览的是第52页

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 高考资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁