《(专科)ch11相关与回归分析教学ppt课件.pptx》由会员分享,可在线阅读,更多相关《(专科)ch11相关与回归分析教学ppt课件.pptx(74页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、(专科)ch11相关与回归分析教学ppt课件第11章 相关与回归分析PPT模板下载:行业PPT模板:节日PPT模板:素材下载:PPT背景图片:图表下载:优秀PPT下载:教程: Word教程: 教程:资料下载:课件下载:范文下载:试卷下载:教案下载:论坛: 本章目录CONTENTS相关与回归分析的概述01一元线性相关分析02多元线性回归分析04一元线性回归分析03随着人民生活的不断改善,轻工业蓬勃发展,但行业内部的竞争压力也日益增大。某市为大力发展轻工业、强化竞争力、提高该市轻工业整体销量及利润,特成立专项小组。经过小组讨论,认为轻工业企业广告费用的投入可能会对其产品销量产生一定的影响,于是专项
2、小组随机抽取了该市15家轻工业企业进行调查,得到这些企业的广告费用(万元)与产品销售量(万件)如下表所示:某市轻工业广告费用及产品销售量情况表某市轻工业广告费用及产品销售量情况表序号广告费用(万元)产品销量(万件)160842354033842471895566762329745608799394554102837114555126477135269143440154961在得到这些数据后,若想要确认该市轻工业企业广告投入费用的多少是否会对其产品销量产生一定的影响,是否广告费用投入越多,轻工业企业销售量就越大?要解决此类问题,就需运用本章所介绍的相关分析法与回归分析法。 变量间的相互依存关系有
3、两种类型:函数关系:函数关系是指变量之间存在着严格确定的数量依存关系,即一个或几个变量X取一定数值时,另一个变量Y总有确定的值与之相对应。例如,圆的直径与其面积的关系,个人所得与应纳个人所得税的关系、钟点工工作时长与其所得劳务报酬的关系、出租车打表距离与其所收费用的关系等等,都属于函数关系。相关关系:相关关系是指变量之间不确定性的数量依存关系,即指当一个变量X(或几个变量)取一定数值时,与之相关的某一个变量Y不是只有唯一一个数值与之对应,而是可能有若干个数值与之对应,这些数值表现出一定的随机波动性,但又总是以一定的规律围绕其均值上下波动。例如,居民收入与居民消费支出之间存在一定关系,当居民收入
4、增加时,居民消费支出一般会随之而增加,但居民收入增加一定数额,居民消费支出并非随之增加固定的数额。因为居民消费支出的变动,还会受到诸如居民消费倾向、价格水平、存款利率等其他很多因素的影响,因此二者之间的关系也属于相关关系而非函数关系。11.1 相关与回归分析的概述相关关系的概念 指变量之间一一对应的确定性的数量依存关系; 设有两个变量 x 和 y ,当变量 x 取某个数值时, y 有确定的值与之对应,则称 y 是 x 的函数y = f (x), 通常将 x 称为自变量,y 称为因变量; 所有观察点全都落在一条线上。 1.函数关系11.1 相关与回归分析的概述相关关系的概念1.是指变量间的关系数
5、量上不确定的依存关系;2.一个变量的取值不能唯一地由另一个变量来确定。即当变量 x 取某个值时,与之相关的变量 y 的取值可能有若干个;3.各观察点分布在直线(或曲线)周围。2.相关关系11.1 相关与回归分析的概述相关关系的概念11.1.2 相关关系的类型v1. 按按涉及变量数目涉及变量数目分为:分为:单相关(一元相关):单相关(一元相关):指仅涉及两个变量仅涉及两个变量的相关关系。复相关(多元相关):复相关(多元相关):指涉及三个或三个以上变量涉及三个或三个以上变量的相关关系。v2. 按按相关关系的表现形式相关关系的表现形式分为:分为:直线相关(线性相关):直线相关(线性相关):指变量之间
6、的数量关系大体上接近于一条直线接近于一条直线。曲线相关(非线性相关):曲线相关(非线性相关):指变量之间的数量关系大体上接近于一条曲线接近于一条曲线。v3. 按按相关方向相关方向分为:分为:正相关:正相关:指两个变量大致呈同方向变化的相关关系,即一个变量的数值增加时,另一个变量的数值也大体上随之而增加随之而增加。负相关:负相关:指两个变量大致呈相反方向变化的相关关系,即当一个变量增加时,另一个变量却大体上随之而减少随之而减少。11.1.3 散点图相关图(也称为散点图。)一对数据对应坐标图上一个点,将成对的观察数据表现为坐标图的散点而形成的图。编制相关表、图的意义有助于分析者判断 相关的有无、方
7、向、形态、密切程度。曲线相关曲线相关不相关不相关(零相关)(零相关)11.1.3 散点图相关关系定量分析的基本内容散点图可对变量之间的相关关系进行直观的视觉分析,我们还需要更精确和更客观的定量分析。相关分析和回归分析是对变量之间相关关系进行定量分析的两大基本内容。相关分析的主要内容是根据观测数据计算相关系数,以此说明变量之间相关的密切程度以及相关方向。相关关系的种类不同,相关系数的计算方法也不尽相同。回归分析是研究存在相关关系的变量之间具体的数量变化关系,只有变量之间关系密切时,进行回归分析才有意义。回归分析的主要内容包括:首先,根据观测数据拟合回归方程,即寻找一个适当的数量关系式来代表变量间
8、平均的数量变化关系,这种数量关系式称为回归方程;其次,对回归方程的可信程度进行检验;最后,利用所选定的回归方程进行分析或预测。相关关系的种类不同,所拟合的回归方程也就有不同类型。进行相关分析的一般程序进行相关分析的一般程序:定量分析定量分析相关表和相关图相关表和相关图计算相关系数计算相关系数和判定系数和判定系数相关关系定量分析的基本内容11.1 相关与回归分析的概述相关关系定量分析的基本内容相关分析与回归分析的区别与联系:l 仅就两个变量而言,相关分析中的两个变量是完全对等的,都看作随机变量,仅是研究变量之间的相关方向及相关程度。不必区分自变量与因变量。而回归分析旨在通过一个变量去解释或预测另
9、一个变量,因此回归分析首先要将所研究变量区分为自变量和因变量。因变量也称为被解释变量,是回归分析所要预测的变量,自变量也称为解释变量,是用来解释和预测因变量的。例如,在分析银行存款利率对居民存款额的影响时,目的是要预测一定的银行存款利率下的居民存款额是多少,因此,居民储蓄额是因变量,而银行存款利率是自变量。对于存在因果关系的变量,应该将“原因”作为自变量,将“结果”作为因变量 。l 另一方面,相关分析与回归分析又具有密不可分的联系。若两个变量之间存在线性相关关系,其线性相关程度越高,所拟合的线性回归方程就越有效,回归估计的误差就越小;反之若两个变量之间不存在线性相关关系,其线性相关程度就越低,
10、所拟合的线性回归方程就越无效,回归估计的误差就越大。若是两个变量之间存在非线性相关关系,相关程度的测定通常又要以回归分析的结果为基础。同样,若是要测定多个变量之间复相关的密切程度,通常也要依靠回归分析的结果。11.2 一元线性相关分析11.2.1 简单线性相关系数11.2.1 简单线性相关系数相关系数相关系数r的的性质性质11.2 一元线性相关分析11.2.1 简单线性相关系数【例11-1】从某市工业企业中随机抽取10个生产同类产品的企业,调查得知它们的研发费用(单位:万元)与产品产量(单位:万件)的数据如下表的第(1)和(2)列所示。试计算相关系数来说明该市工业企业中研发费用与产品产量之间的
11、相关关系。序号(甲)(1)(2)130402354533542455655707568090790100896110910412010105123合计70081011.2.1 简单线性相关系数企业的研发费用与产品产量及其相关系数计算表企业的研发费用与产品产量及其相关系数计算表序号(甲)(1)(2)(3)(4)(5)(6)(7)13040-40-4116401600168123545-35-3612601225129633542-35-3913651225152145565-15-16240225256570750-6003668090109901008179010020193804003618
12、96110262975467684191041203439132611561521101051233542147012251764合计7008100085257832935811.2.2 相关系数的显著性检验t 检验提出假设:H0: ;H1: 0确定检验的统计量:当X,Y均为正态随机变量时,计算检验统计量的值计算检验统计量的值 或或 P值,确定显著性水平值,确定显著性水平 n 若若 t t 或或 P值值0,Xrs0,X和和Y Y正相关;正相关;rs0rs0,负相关,负相关,rs=0rs=0,不相关。,不相关。11.2.3 等级相关系数 【例例11-2】试根据例11-1的数据计算该市工业企业中研
13、发费用与产品产量之间的等级相关关系。解:解:先计算样本中各个企业在研发费用与产品产量两个变量上的排序位次,再计算对应的位次差及其平方,如下表所示。企业研发费用与产品产量的等级相关系数计算表企业研发费用与产品产量的等级相关系数计算表序号研发费用的排序位次 xsi产品产量的排序位次ysi(甲)(1)(2)(3)(4)(5)(6)130401100235452.53-0.50.25335422.520.50.25455654400570755500680906600790100770089611088009104120990010105123101000合计700810555500.511.2.3
14、等级相关系数 根据上表所计算的结果,由式(11-4)可计算得:2S2660 .51=10 .9 9 6 9 7(1)1 0(1 0 01)idrnn可见,该市工业企业中研发费用与产品产量的等级顺序之间存在高度线性正相关关系。利用SPSS可直接计算两组定量数据的Spearman相关系数(Spearmans rho),且同时输出检验的P值和样本量等信息。例11-2的输出结果如图11-2所示。 SPSS的Spearman相关系数输出结果图11.2.3 等级相关系数 11.3 一元线性回归分析一元线性回归方程的估计“回归”一词最早是由英国生物学家高尔顿(Galton)在遗传学研究中提出来的。现代意义的
15、现代意义的“回归回归”是研究一个变量是研究一个变量(因变量因变量)对另外一个或多个变量对另外一个或多个变量(自变量自变量)的依存关系的统计方法,其目的就是寻找一个适当的数量关系式(回归方程)来的依存关系的统计方法,其目的就是寻找一个适当的数量关系式(回归方程)来近似代表变量间依存关系并据以进行估计或预测。近似代表变量间依存关系并据以进行估计或预测。回归方程中自变量可以只有一个,也可以有两个和两个以上,因此,按照自变量的个数来划分,回归分析相应地可分为一元回归分析和多元回归分析。回归分析相应地可分为一元回归分析和多元回归分析。根据回归方程的形态,回归分析又可以分为线性回归分析和非线性回归分析。这
16、里只介绍一元线性回归分析。回归分析的意义广义的相关分析变量之间相关关系的分析 狭义的相关分析 回归分析11.3 一元线性回归分析一元线性回归方程的估计回归分析的内容1.从一组样本数据出发,确定变量之间的数学关系式建立回归模型;借助于数学模型来表达变量之间的平均数量关系2.对这些关系式的可信程度进行各种统计检验并从某一特定变量的诸多影响因素(变量)中找出哪些变量的影响显著,哪些不显著;3.利用所求的回归模型进行分析,预测或控制 (并给出这种预测或控制的精确程度) 。11.3 一元线性回归分析一元线性回归方程的估计回归模型的类型v1. 按涉及变量多少分为:简单回归(一元回归)复回归(多元回归)v2
17、. 按回归曲线的形态分为:直线回归(线性回归)曲线回归(非线性回归)11.3 一元线性回归分析一元线性回归方程的估计1.总体回归方程和样本回归方程的概念11.3 一元线性回归分析一元线性回归方程的估计1.总体回归方程和样本回归方程的概念11.3 一元线性回归分析一元线性回归方程的估计2.随机项的基本假定11.3 一元线性回归分析一元线性回归方程的估计最小平方法也称为最小二乘法使因变量的观察值与估计值之间的离差平方和达到最小来求得 a和b 的方法,即满足下列条件: Q= = minniiixy120)(niiiyy12)(3.回归方程参数的估计方法最小二乘法11.3 一元线性回归分析一元线性回归
18、方程的估计nxnyxyxxyyxxiiiii11021)()(3.回归方程参数的估计方法最小二乘法11.3 一元线性回归分析一元线性回归方程的估计3.回归方程参数的估计方法最小二乘法【例11-3】根据例11-1的数据,试建立该市工业企业研发费用与产品产量之间的回归方程。解:对于工业企业来说,研发费用支出显然是影响工业企业产品产量的一个重要因素,因此,将研发费用作为自变量X,将企业产品产量作为因变量Y。根据前例中的计算结果,可得:上述回归方程表明,当没有研发费用投入时,即X=0时,产品产量平均只有4.8062万件;当研发费用投入每增加一万元时,企业的产品产量将平均增加1.0885万件。11.3
19、一元线性回归分析一元线性回归方程的估计3.回归方程参数的估计方法最小二乘法用用Excel的的“数据分析数据分析”中的中的“回归回归”可实现线性回归分析的有关计算,输出结果如可实现线性回归分析的有关计算,输出结果如下图下图所示。所示。11.3 一元线性回归分析一元线性回归方程的估计例例11-311-3的的ExcelExcel回归输出结果回归输出结果图图1.判定系数因变量 y 的取值是不同的,y 取值的这种波动称为变差或离差。对一个具体的观测值来说,变差的大小可以通过该实际观测值与其均值之差 来表示。变差来源于两个方面:由于自变量 x 的取值不同造成的;除 x 以外的其他因素 (包括 x 对 y
20、的非线性影响、测量误差等)的影 响。11.3 一元线性回归分析11.3.2 一元线性回归方程的拟合效果离差平方和的分解(图示)离差分解图xy11.3 一元线性回归分析11.3.2 一元线性回归方程的拟合效果1.对于任意一个观察点,有:总变差回归变差+剩余变差2. 对于全部观察点,两端平方后求和,有:记为:记为: SST SSR + SSE总变差平方和总变差平方和回归平方和回归平方和残差平方和残差平方和11.3 一元线性回归分析11.3.2 一元线性回归方程的拟合效果离差平方和的分解三个离差平方和的意义1.总(离差)平方和(SST)反映因变量的 n 个观察值与其均值的总离差2.回归平方和(SSR
21、)反映自变量 x 的变化对因变量 y 取值变化的影响,或者说,是由于x与y之间的线性关系引起的y的取值变化。也称为可解释的平方和。3.残差平方和(SSE、Q)反映除 x 以外的其他因素对 y 取值的影响,也称为不可解释的平方和或剩余平方和。11.3 一元线性回归分析11.3.2 一元线性回归方程的拟合效果样本判定系数(决定系数样本判定系数(决定系数r 2 )判定系数判定系数=回归平方和占总离差平方和的比例在直线相关中,判定系数=相关系数的平方,即 r2(r)2反映回归直线的拟合程度,衡量变量之间的相关程度。取值范围在 0 , 1 之间。 r r2 2 1 1,说明回归方程拟合效果越好;,说明回
22、归方程拟合效果越好; r r2 20 0,说,说明回归方程拟合得越差。明回归方程拟合得越差。11.3 一元线性回归分析11.3.2 一元线性回归方程的拟合效果相关系数的另一个计算公式SSRrSST22()11()SSEyyrSSTyy在直线相关的条件下,由于在直线相关的条件下,由于相关系数等于判定系数的平方根相关系数等于判定系数的平方根,所,所以,由判定系数的计算公式可得,相关系数也可以由下述公式计以,由判定系数的计算公式可得,相关系数也可以由下述公式计算:算:即:即:11.3 一元线性回归分析11.3.2 一元线性回归方程的拟合效果11.3 一元线性回归分析11.3.2 一元线性回归方程的拟
23、合效果2回归估计标准误差2e12inSnie2)(12nyyniii2SSEn11.3 一元线性回归分析11.3.2 一元线性回归方程的拟合效果反映实际观察值在回归直线周围的分散状况;反映实际观察值在回归直线周围的分散状况;反映因变量各实际值与其回归估计值之间的平均差反映因变量各实际值与其回归估计值之间的平均差异程度;异程度;说明了回归直线的拟合程度(衡量回归方程的说明了回归直线的拟合程度(衡量回归方程的代表性,代表性,测定回归估计的精度测定回归估计的精度)其值越小,估计值(或回归方程)的代表性越其值越小,估计值(或回归方程)的代表性越强,用回归方程估计或预测的结果越准确强,用回归方程估计或预
24、测的结果越准确11.3 一元线性回归分析11.3.2 一元线性回归方程的拟合效果回归估计标准误差 Se与一般的标准差的异同相同: 都是离差的平方的平均数的平方根; 反映平均差异程度; 衡量代表性大小。主要区别: 与什么的离差、差异; 衡量谁的代表性。 11.3 一元线性回归分析11.3.2 一元线性回归方程的拟合效果回归估计标准差与相关系数的关系回归估计标准差与相关系数的关系大样本条件下,近似地:或:2222() /11() /eyySyynrynS 表明表明:相关系数可以间接说明回归估计的精确度;回相关系数可以间接说明回归估计的精确度;回归估计标准误差也可以间接说明变量之间相关的密切归估计标
25、准误差也可以间接说明变量之间相关的密切程度。程度。11.3 一元线性回归分析11.3.2 一元线性回归方程的拟合效果如前所述,总体回归模型的参数是不能直接计算的,只能通过样本观测值去估计,如前所述,总体回归模型的参数是不能直接计算的,只能通过样本观测值去估计,而估计量是随抽样而变动的随机变量,那么所估计的回归方程是否可靠就至关重要。因此在应用所估计的回因此在应用所估计的回归方程之前还应该检验其是否具有统计显著性,即检验自变量归方程之前还应该检验其是否具有统计显著性,即检验自变量X对因变量对因变量Y的线性影响是否显著,的线性影响是否显著,是否真实地反映了自变量是否真实地反映了自变量X与因变量与因
26、变量Y之间的关系。之间的关系。通常是对如下的假设进行显著性检验0:10H0:11H11.3 一元线性回归分析一元线性回归方程的显著性检验1.一元线性回归方程的F检验 提出假设:提出假设:H H0 0: 1=01=0(线性关系不显著);线性关系不显著);H H1 1: 1 1 0 0 (线性关系显著)线性关系显著) 确定检验统计量:确定检验统计量:确定显著性水平确定显著性水平 , , 找出临界值找出临界值F F (1(1,n n-2);-2);计算统计量的样本观察值或计算统计量的样本观察值或P P值;值;作出决策:若作出决策:若 F F F F 或或 P P值值 t (n-2) ,或或 P值值
27、,拒绝拒绝H0;反之,不能拒绝反之,不能拒绝 H0)2()(/2e111ntxxSSti2.回归系数的t检验回归分析的一个主要目的主要目的是利用估计的回归方程对因变量作合理的预测。在通过各种检验并符合预定的要求后,就可以利用回归方程根据自变量X的数值来估计或预测因变量Y的取值。这种预测称为回归预测。回归预测按照所要预测的范围可以分为点预测和区间预测。ffxy1011.3 一元线性回归分析11.3.4 利用一元线性回归方程进行预测区间预测对于自变量 x 的一定值 x0 ,在1-置信水平下,因变量 y 的取值 y0的预测区间为:其中其中,11.3 一元线性回归分析11.3.4 利用一元线性回归方程
28、进行预测回归预测的置信区间xOy置信上限置信下限x置信区间半径x11.3 一元线性回归分析11.3.4 利用一元线性回归方程进行预测影响估计区间宽度的因素1. 置信水平 (1 - ) 区间宽度随置信水平的增大而增大2. 回归估计标准差 (Se) 区间宽度随离散程度的增大而增大3. 样本容量 n 区间宽度随样本容量的增大而减小4. 用于预测的 xo与x 的差异程度。 区间宽度随xo与x 的差异程度的增大而增大11.3 一元线性回归分析11.3.4 利用一元线性回归方程进行预测大样本下的预测区间, 00yy200(,)eyN y S n 充分大时,充分大时,X=x0时,时,y0的置信区间为:的置信
29、区间为:其中,其中,11.3 一元线性回归分析11.3.4 利用一元线性回归方程进行预测xxOy置信上限置信下限x区间半径11.3 一元线性回归分析11.3.4 利用一元线性回归方程进行预测大样本下的预测区间即当企业的研发费用达到100万元时,在0.99的置信水平下,产品产量的预测区间为:(8111.64)即(79.36,92.64)万件。11.3 一元线性回归分析11.3.4 利用一元线性回归方程进行预测注意应用回归估计(预测)时注意:1. 内插效果优于外推效果,不宜外推太远;内插: x0 ( xmin , xmax)时外推: x0 ( xmin , xmax )时2. n 不能太小,即用于
30、拟合回归方程的数据不能太少。11.3 一元线性回归分析11.3.4 利用一元线性回归方程进行预测11.4 多元线性回归分析多元线性回归方程的估计在许多实际问题中,一个现象的变动往往要受多种现象变动的影响。例如,消费支出不仅除了受本期收入水平的影响外,还受物价水平、消费偏好、以前的收入水平以及预期收入水平等因素的影响。因此,在进行相关回归分析时,常常需要对多个变量之间的关系进行研究。11.4 多元线性回归分析多元线性回归方程的估计kii2i 1iXXXYk110.2201 122()()iikkQyyyxxx11.4 多元线性回归分析11.4.2 多元线性回归方程的拟合效果1.1.估计标准误差估
31、计标准误差多元线性回归模型同样可以用估计标准误差、判定系数等指标来评价其拟合效果。其计算原理与一元线性回归分析的计算原理基本相同。多元线性回归方程的估计标准误差多元线性回归方程的估计标准误差的计算公式为1)(12knyySniiie式中,n为样本量,k为自变量个数。当k=1时,式(11-31)就变成了一元回归分析中的估计标准误差的计算公式(11-16)。可见,一元与多元回归分析中的估计标准误差的计算原理及其含义是一致的,估计标准误差Se越小,表明样本回归方程的拟合效果越好,平均说来回归估计值的误差越小。11.4 多元线性回归分析11.4.2 多元线性回归方程的拟合效果2.判定系数和复相关系数2
32、22()=()yySSRRSSTyy11.4 多元线性回归分析11.4.2 多元线性回归方程的拟合效果2.判定系数和复相关系数11.4 多元线性回归分析11.4.2 多元线性回归方程的拟合效果2.判定系数和复相关系数测定多元相关关系的密切程度,除了可以用判定系数或修正的判定系数,还可以用复相关系数。复复相关系数等于判定系数的平方根,记为相关系数等于判定系数的平方根,记为R,其计算公式为22()=()yySSRRSSTyy11.4 多元线性回归分析11.4.3 多元线性回归的显著性检验1.回归方程的显著性检验/( , - -1)/( - -1)SSR kFF k n kSSEn k11.4 多元
33、线性回归分析11.4.3 多元线性回归的显著性检验1.回归方程的显著性检验回归模型的方差分析表回归模型的方差分析表11.4 多元线性回归分析11.4.3 多元线性回归的显著性检验2.回归系数的显著性检验在多元线性回归中,由于自变量不只一个,通过F检验后只能说明k个总体回归系数不全为0,即至少有一个自变量与因变量的线性关系显著,并不能说明所有的自变量都对因变量有显著影响,即不能说明说明并不能说明所有的自变量都对因变量有显著影响,即不能说明说明k个总体回归系数全不为个总体回归系数全不为0。因此,还需要进一步对每一个回归系数做显著性检验。待检验的假设为:对上述假设的检验采用t检验法,检验统计量为:1
34、1.4.4 多元线性回归的应用举例【例11-5】2016年我国各地区房地产业行业增加值(亿元)、人均GDP(元)和年末人口数(万人)取对数后的数据如下表所示,Y=房地产业行业增加值的自然对数,X1=人均GDP的自然对数,X2=年末人口数的自然对数。试利用Excel分析取对数后的变量之间的相关性,建立线性回归方程并进行显著性检验,同时说明其经济含义。20162016年我国各地区房地产业增加值、人均年我国各地区房地产业增加值、人均GDPGDP和年末人口数和年末人口数对数值表对数值表地区YX1X2地区YX1X2北京7.42218211.680127.683864湖北7.16344310.927118
35、.680162天津6.69198411.653157.353722湖南6.7794910.744678.827908河北7.30547010.67048.918650广东8.73705111.212049.305560山西6.54897810.478198.211211广西6.61879210.546058.484257内蒙古6.11765711.185317.832014海南5.8577910.69986.821107辽宁6.94440510.835478.384347重庆6.83107910.976828.022241吉林6.16663610.894297.913155四川7.324233
36、10.596719.019422黑龙江6.42470710.607388.242493贵州5.51825610.411698.176110上海7.66181911.666187.791523云南5.71689610.344748.470311江苏8.36469211.48138.987072西藏3.5106510.468355.802118浙江7.86595511.349428.628735陕西6.61629310.839878.246172安徽7.02471110.58568.731659甘肃5.56025810.227137.867106福建7.14651211.221338.262043
37、青海4.0276710.681236.385194江西6.61457810.599288.432071宁夏4.63054510.762026.514713山东7.92779011.137989.205026新疆5.69917210.610647.782390河南7.54433710.659029.16241011.4.4 多元线性回归的应用举例利用Excel的数据分析数据分析中“相关系数相关系数”可计算上表中三个变量的两两相关系数,如表11-7所示。YX1X2Y 1X10.55361X20.82880.07421例例11-511-5的相关系数矩阵的相关系数矩阵由表可见,Y与X1呈线性正相关,相
38、关系数为0.5536,属于显著相关;Y与X2同样呈线性正相关,为0.7282,属于高度相关。同时,X1与X2之间的线性相关性很弱(相关系数为0.0742)。因此,可建立以Y为因变量,X1与X2为自变量的二元线性回归方程。11.4.4 多元线性回归的应用举例利用Excel的数据分析中“回归”可进行多元线性回归分析。本例的输出结果如下图所示。11.4.4 多元线性回归的应用举例本章小结7301 相关关系是指变量之间不确定性的数量依存关系。从变量多少来分有简单相关和复相关;从表现形式来分有线性相关和非线性相关;从相关方向来分有正相关和负相关。散点图可以直观地描述相关关系的方向、形态和强弱程度。02
39、相关分析研究变量间相关关系的方向和密切程度。Pearson相关系数度量两个定量变量之间线性相关的密切程度,度量两个定序变量之间线性相关的密切程度常用Spearman等级相关系数。对相关系数的显著性检验通常是检验总体相关系数是否等于零,采用t检验。03 04 判定系数r2 是回归平方和在总离差平方和中所占比重,数值越大,表示回归方程的拟合效果越好。多元线性回归分析关注修正的判定系数。回归估计标准误差Se反映因变量的实际观测值与回归估计值之间的平均误差程度,其值越小,表示回归方程的代表性越好。本章小结7405 对一元线性回归方程的显著性检验就是检验总体回归系数是否等于零,此时t检验和F检验是等价的。在多元线性回归分析中,F检验是对整个回归方程是否显著的检验,而t检验是分别就回归方程中每一个自变量对因变量的线性影响是否显著进行检验。06 回归方程可用于对因变量进行估计或预测,可作点预测,也可作区间预测。07 相关分析和回归分析中的计算与散点图绘制都可以运用Excel或SPSS去实现。