《相关分析与回归分析PPT.ppt》由会员分享,可在线阅读,更多相关《相关分析与回归分析PPT.ppt(27页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、相关分析与回归分析PPT现在学习的是第1页,共27页章节提纲:1.相关分析概论2.相关关系的测定3.一元线性回归分析4.多元线性回归分析现在学习的是第2页,共27页第一、二节 相关分析概述相关关系测定 现在学习的是第3页,共27页变量间关系变量间关系血压血压 年龄年龄动物死亡率动物死亡率 毒物剂量毒物剂量体重体重身高身高肺活量肺活量体重体重相关相关:血压和年龄血压和年龄关联的程度如何关联的程度如何?动物死亡率与毒物剂量动物死亡率与毒物剂量关联的程度如何关联的程度如何?回归回归:人群中人群中,平均而言平均而言,血压血压 如何随年龄变化如何随年龄变化?毒性实验中毒性实验中,动物死亡率动物死亡率如何
2、随剂量变化如何随剂量变化?现在学习的是第4页,共27页散点图散点图Fig.7.1收缩压和收缩压和舒张压舒张压(mmHg)(665名名6至至10岁女孩岁女孩)收缩压收缩压舒张压现在学习的是第5页,共27页指数函数指数函数对数函数对数函数正弦函数正弦函数Y 和和 X之间的函数关系之间的函数关系对应于给定的对应于给定的X值值,相应的相应的Y值是确定的值是确定的.现在学习的是第6页,共27页现在学习的是第7页,共27页三、相关关系三、相关关系P177 相关系数是度量两个变量之间线性相关的方向和强度的测度,常用的度量指标是皮尔逊(Pearson)相关系数【专栏】在相关分析中,定性分析或经济理论分析重要吗
3、【专栏】在相关分析中,定性分析或经济理论分析重要吗?correlation coefficient现在学习的是第8页,共27页 相关系数相关系数(Correlation Coefficient)1.总体相关系数总体相关系数(Population correlation coefficient)Pearsons 乘积乘积-矩线性相关系数矩线性相关系数:“两个两个标准化标准化变量之乘积变量之乘积”的总体平均的总体平均-简单相关系数简单相关系数(simple correlation coefficient)-X和和Y的总体协方差的总体协方差现在学习的是第9页,共27页去掉n,公式如下:现在学习的是第
4、10页,共27页现在学习的是第11页,共27页度量线性关系的强度和方向度量线性关系的强度和方向:1)r=0-无线性关系无线性关系,或很弱或很弱 2)若绝对值较大若绝对值较大 -线性关系较强线性关系较强 3)符号正负符号正负 -线性关系的方向线性关系的方向 4)+1or-1-完全相关完全相关,实践中少见实践中少见P181现在学习的是第12页,共27页例子8-1 P180 现在学习的是第13页,共27页第三节第三节 一元线性回归分析一元线性回归分析现在学习的是第14页,共27页第三节 一元线性回归分析 回归分析实质就是通过建立回归分析实质就是通过建立数学方程数学方程,研究因变量与,研究因变量与自变
5、量之间的变动关系,如果分析自变量之间的变动关系,如果分析一个自变量与一个一个自变量与一个因变量因变量的的线性线性关系,称为关系,称为一元线性回归分析一元线性回归分析,如果分析,如果分析两个或两个以上两个或两个以上的自变量与的自变量与一个因变量一个因变量的的线性线性关系,关系,则称为则称为多元线性回归多元线性回归。现在学习的是第15页,共27页一、一元线性回归理论模型一、一元线性回归理论模型一元线性回归模型是用于分析一个自变量一个自变量x与一个因变量与一个因变量y之间线性关系的数学方程,在变量x与y的直角坐标平面上,可以绘制散点图,可以看出所有的散点大致呈线性关系 or在一元线性回归之中,因变量
6、由两个部分组成,一个是 ,其解释了自变量x变动引发的线性变化。另一部分为剩余变动 ,反映了不能为自变量x和因变量y之间的线性关系所解释的其他剩余变动。现在学习的是第16页,共27页最小平方法最小平方法 OLS是测定是测定长期趋势最常用的的方法长期趋势最常用的的方法。它是通过建立。它是通过建立数学方程数学方程,对元,对元时间序列配合一条较为理想的趋势线,使得原序列中的各时间序列配合一条较为理想的趋势线,使得原序列中的各实际值实际值和趋势值的离差平方最小和趋势值的离差平方最小。一般最小平方法的统计表达式是:。一般最小平方法的统计表达式是:式中式中:观察方法:观察方法:散点图或分配数量规律观察散点图
7、或分配数量规律观察现在学习的是第17页,共27页(一)直线方程(一)直线方程适用条件:现象发展的各期逐期增长量大体相等现象发展的各期逐期增长量大体相等。年份1990 1991 1992 1993 1994 1995 1996 19971998粮食产量100112125140155168180194206逐期增长量-1213151513121412现在学习的是第18页,共27页即趋势值直线方程公式表示为:上述直线方程式中,a、b为两个未定参数,根据最小平方法的要求现在学习的是第19页,共27页求方程组:例例-某省某省19911998年人口资料如表所示,要求拟合时点的趋势方程,并以此年人口资料如表
8、所示,要求拟合时点的趋势方程,并以此趋势预测趋势预测1999年末的人口数。年末的人口数。8763n=8b求出来都代入到a公式里面y现在学习的是第20页,共27页根据上述公式:根据上述公式:将将1999年时间序列号年时间序列号9带入配合的趋势方程,可得到带入配合的趋势方程,可得到1999年末某省人口数的趋势值(预年末某省人口数的趋势值(预测值)测值)既,1999年末该省人口数将达到9402.94万人。例子 8-2 P184现在学习的是第21页,共27页上述方程中的上述方程中的x为时间:为时间:当时间项数为当时间项数为奇数奇数时,可假设时,可假设x的中间项为的中间项为0,这时时间项依次排列为:,这
9、时时间项依次排列为:,-3,-2,-1,0,1,2,3,;当时间项数为当时间项数为偶数偶数时,可假设原点时,可假设原点0在数列正中相另两个时间的中点,这时时间在数列正中相另两个时间的中点,这时时间项依次排列为:项依次排列为:,-5,-3,-1,0,1,3,5,为了方便手工计算,可以把原数列的重点移至坐标原点,使得为了方便手工计算,可以把原数列的重点移至坐标原点,使得”x=0“,此时,标,此时,标准方程可以化为:准方程可以化为:现在学习的是第22页,共27页例例-用简便的方法来计算上面例子。用简便的方法来计算上面例子。1999年的时间序号应该为9.现在学习的是第23页,共27页年份1990 19
10、91 1992 1993 1994 1995 1996 19971998粮食产量100112125140155168180194206逐期增长量-1213151513121412本例中各期的逐期增长量大体相同逐期增长量大体相同,可以配合直线趋势方程。Practic-某地区各年的粮食产量为:Tip:现在学习的是第24页,共27页案例:某地区粮食产量直线趋势方程计算年份xyxy1990-4100-400161991-3112-33691992-2125-25041993-1140-14011994015500199511681681199621803604199731945829199842068
11、2416合计-138080860现在学习的是第25页,共27页(i)已知:)已知:n对观察值对观察值(X1,Y1),(X2,Y2),(Xn,Yn););(ii)作散点图()作散点图(scatter diagram)(iii)若散点图呈直线趋势,则配一条直线)若散点图呈直线趋势,则配一条直线:求出直线的方程式求出直线的方程式 线性回归三步骤线性回归三步骤现在学习的是第26页,共27页什麽是回归?找出反映平均水平的那条直线的方程找出反映平均水平的那条直线的方程100120140160180200220100120140160180200220Fathers heightFathers height(cmcm)Sons height(cm)Y的平均值是如何依赖的平均值是如何依赖X现在学习的是第27页,共27页