第10章-相关与回归分析ppt课件.ppt

上传人:飞****2 文档编号:32301835 上传时间:2022-08-08 格式:PPT 页数:13 大小:108.50KB
返回 下载 相关 举报
第10章-相关与回归分析ppt课件.ppt_第1页
第1页 / 共13页
第10章-相关与回归分析ppt课件.ppt_第2页
第2页 / 共13页
点击查看更多>>
资源描述

《第10章-相关与回归分析ppt课件.ppt》由会员分享,可在线阅读,更多相关《第10章-相关与回归分析ppt课件.ppt(13页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、第第1010章章 相关相关与回归分析与回归分析Xiang YE, Information School, RUC统计数据分析基础教程统计数据分析基础教程基于基于SPSSSPSS和和ExcelExcel的调查数据分析的调查数据分析第第1010章章相关与回归分析相关与回归分析第第1010章章 相关相关与回归分析与回归分析Xiang YE, Information School, RUC本章内容本章内容10.110.1 问题的提出问题的提出10.210.2 定量变量的线性相关分析定量变量的线性相关分析10.3 10.3 利用利用SPSSSPSS实现线性相关分析实现线性相关分析10.4 10.4 定量

2、变量的线性回归分析定量变量的线性回归分析10.5 10.5 利用利用SPSSSPSS实现线性回归分析实现线性回归分析10.6 10.6 利用利用ExcelExcel图表实现一元线性回图表实现一元线性回归分析归分析10.7 10.7 利用利用ExcelExcel回归分析工具实现多回归分析工具实现多元线性回归分析元线性回归分析第第1010章章 相关相关与回归分析与回归分析Xiang YE, Information School, RUC相关分析与回归分析相关分析与回归分析相关分析相关分析是分析客观事物之间关系的数量分是分析客观事物之间关系的数量分析方法。客观事物之间的关系大致可归纳为析方法。客观事

3、物之间的关系大致可归纳为两大类关系,分别是两大类关系,分别是函数关系函数关系和和统计关系统计关系。相关分析是用来分析事物之间相关分析是用来分析事物之间统计关系统计关系的方的方法法。回归分析回归分析是一种应用极为广泛的数量分析方是一种应用极为广泛的数量分析方法。它法。它用于分析事物之间的用于分析事物之间的统计关系统计关系,侧重,侧重考察变量之间的数量变化规律,并通过考察变量之间的数量变化规律,并通过回归回归方程方程的形式描述和反映这种关系的形式描述和反映这种关系,帮助人们,帮助人们准确把握变量受其他一个或多个变量影响的准确把握变量受其他一个或多个变量影响的程度,进而为预测提供科学依据。程度,进而

4、为预测提供科学依据。第第1010章章 相关相关与回归分析与回归分析Xiang YE, Information School, RUC10.1 10.1 问题的提出问题的提出发现变量之间的统计关系,并且用此规律来帮助人们进行发现变量之间的统计关系,并且用此规律来帮助人们进行决策才是统计实践的最终目的。决策才是统计实践的最终目的。一般来说,统计可以根据目前所拥有的信息(数据)来建一般来说,统计可以根据目前所拥有的信息(数据)来建立人们所关心的变量和其他有关变量的关系。这种关系一立人们所关心的变量和其他有关变量的关系。这种关系一般称为般称为模型模型(ModelModel)。)。假如用假如用Y Y表示

5、感兴趣的变量,用表示感兴趣的变量,用X X表示其他可能与表示其他可能与Y Y有关的变有关的变量(量(X X也可能是若干变量组成的向量),则所需要的是建立也可能是若干变量组成的向量),则所需要的是建立一个一个函数关系函数关系Y Yf f(X X)。这里这里Y Y称为称为因变量因变量或响应变量(或响应变量(Dependent VariableDependent Variable,Response VariableResponse Variable),而),而X X称为称为自变量自变量,也称为解释变量,也称为解释变量或协变量(或协变量(Independent VariableIndependent

6、Variable,Explanatory Explanatory VariableVariable,CovariateCovariate)。)。建立这种关系的过程就叫做回归建立这种关系的过程就叫做回归(RegressionRegression)。)。第第1010章章 相关相关与回归分析与回归分析Xiang YE, Information School, RUC10.1 10.1 问题的提出问题的提出例例10-1 10-1 有美国有美国6060个著名商学院的数据,包括的变个著名商学院的数据,包括的变量有量有GMATGMAT分数、学费、进入分数、学费、进入MBAMBA前后的工资等。前后的工资等。进

7、入进入MBAMBA前后工资的散点图。可以看出,前后工资的散点图。可以看出,进入进入MBAMBA前工资高的,毕业后工资也高前工资高的,毕业后工资也高。希望能够建立一个希望能够建立一个模型模型描述这个关系。描述这个关系。第第1010章章 相关相关与回归分析与回归分析Xiang YE, Information School, RUC10.210.2 定量变量的线性相关分析定量变量的线性相关分析如果如果两个定量变量两个定量变量没有关系,就谈不上建立模型或没有关系,就谈不上建立模型或进行回归进行回归。但怎样才能发现两个定量变量有没有关。但怎样才能发现两个定量变量有没有关系呢?最简单的直观办法就是画出它们

8、的系呢?最简单的直观办法就是画出它们的散点图散点图。散点图很直观,但如何在数量上描述相关呢?这里散点图很直观,但如何在数量上描述相关呢?这里介绍一种对相关程度的度量:介绍一种对相关程度的度量: PearsonPearson相关系数相关系数(Pearsons Correlation CoefficientPearsons Correlation Coefficient)。)。PearsonPearson相关系数相关系数又称又称相关系数相关系数或或线性相关系数线性相关系数。它是由它是由两个变量的样本两个变量的样本取值得到,是一个取值得到,是一个描述线性描述线性相关强度的量相关强度的量,一般用字母,

9、一般用字母r r表示。取值在表示。取值在-1-1和和+1+1之间。当两个变量有很强的线性相关时,相关系数之间。当两个变量有很强的线性相关时,相关系数接近于接近于+1+1(正相关正相关)或)或-1-1(负相关负相关),而当两个变),而当两个变量线性相关程度较弱时,相关系数就接近量线性相关程度较弱时,相关系数就接近0 0。第第1010章章 相关相关与回归分析与回归分析Xiang YE, Information School, RUC10.3 10.3 利用利用SPSSSPSS实现线性相关分析实现线性相关分析对于对于例例10-110-1,利用,利用SPSSSPSS可以很容易得可以很容易得到到进入进入

10、MBAMBA前后工资前后工资之间的之间的线性相关系线性相关系数数。菜单:菜单:“AnalyzeAnalyze”-“”-“CorrelateCorrelate” - -“BivariateBivariate”结果:进入结果:进入MBAMBA前后工资的线性相关系前后工资的线性相关系数数r=0.924r=0.924, ,且检验的且检验的p p值为值为0.0000.000,说说明这两个变量线性相关明这两个变量线性相关,因此可以考,因此可以考虑建立线性回归模型。虑建立线性回归模型。第第1010章章 相关相关与回归分析与回归分析Xiang YE, Information School, RUC10.410

11、.4 定量变量的线性回归分析定量变量的线性回归分析回归分析回归分析是研究变量间相关关系的最重要、最常是研究变量间相关关系的最重要、最常用的统计方法,它在工农业生产、金融保险、商用的统计方法,它在工农业生产、金融保险、商业与科研管理、气象地质等方面都有极其广泛的业与科研管理、气象地质等方面都有极其广泛的应用,为解决实际中的预测、控制等问题提供了应用,为解决实际中的预测、控制等问题提供了强有力的工具。强有力的工具。最小二乘回归最小二乘回归(Least Squares RegressionLeast Squares Regression)。)。古汉语古汉语“二乘二乘”是平方的意思。是平方的意思。最小

12、二乘法就是寻找一条直线最小二乘法就是寻找一条直线,使得所有点到该,使得所有点到该直线的竖直距离(即按因变量方向的距离)的平直线的竖直距离(即按因变量方向的距离)的平方和最小。这样的直线很容易通过计算机得到。方和最小。这样的直线很容易通过计算机得到。用数据寻找一条直线的过程也叫做用数据寻找一条直线的过程也叫做拟合拟合(FitFit)一)一条条直线直线。第第1010章章 相关相关与回归分析与回归分析Xiang YE, Information School, RUC10.5 10.5 利用利用SPSSSPSS实现线性回归分析实现线性回归分析对于对于例例10-110-1,关心的是,关心的是Salary

13、 Post Salary Post MBAMBA(y y)和什么有关。)和什么有关。利用利用逐步回归逐步回归进行选择。进行选择。通过通过SPSSSPSS软件得到软件得到三个自变量三个自变量:Salary Pre MBASalary Pre MBA(x x1 1)Five Year GainFive Year Gain(x x2 2)Years To PaybackYears To Payback(x x3 3)菜单:菜单:“AnalyzeAnalyze”-“”-“RegressionRegression” -“ -“LinearLinear”123106.8921.0550.88332.442

14、yxxx 第第1010章章 相关相关与回归分析与回归分析Xiang YE, Information School, RUC10.5 10.5 利用利用SPSSSPSS实现线性回归分析实现线性回归分析对于对于例例10-110-1,关心的是,关心的是Salary Post MBASalary Post MBA(y y)和什么有关。)和什么有关。利用求得的多元线性回归方程可知:利用求得的多元线性回归方程可知: (1 1)三个自变量都)三个自变量都正向影响正向影响Salary Post MBASalary Post MBA(y y);); (2 2)Salary Pre MBASalary Pre M

15、BA(x x1 1)对)对Salary Post MBASalary Post MBA(y y)的影响程)的影响程度:度:在在Five Year GainFive Year Gain(x x2 2)和)和Years To PaybackYears To Payback(x x3 3)不变的)不变的条件下条件下,Salary Pre MBASalary Pre MBA(x1x1)每增加)每增加(或减少)(或减少)1 1个单位,个单位,Salary Post MBASalary Post MBA平均增加平均增加(或减少)(或减少)1.0551.055个单位。个单位。 (3 3)Five Year

16、GainFive Year Gain(x x2 2)对)对Salary Post MBASalary Post MBA(y y)的影响程)的影响程度:度:在在Salary Pre MBASalary Pre MBA(x x1 1)和)和Years To PaybackYears To Payback(x x3 3)不变的)不变的条件下条件下,Five Year GainFive Year Gain(x x2 2)每增加)每增加(或减少)(或减少)1 1个单位,个单位,Salary Post MBASalary Post MBA平均增加平均增加(或减少)(或减少)0.8830.883个单位。个单

17、位。 (4 4)Years To PaybackYears To Payback(x x3 3)对)对Salary Post MBASalary Post MBA(y y)的影响)的影响程度:程度:在在Salary Pre MBASalary Pre MBA(x x1 1)和)和Five Year GainFive Year Gain(x x2 2)不变的)不变的条件下条件下,Years To PaybackYears To Payback(x x3 3)每增加)每增加(或减少)(或减少)1 1个单位,个单位,Salary Post MBASalary Post MBA平均增加平均增加(或减少

18、)(或减少)32.44232.442个单位。个单位。123106.8921.0550.88332.442yxxx 第第1010章章 相关相关与回归分析与回归分析Xiang YE, Information School, RUC10.610.6 利用利用ExcelExcel图表实现图表实现一元线性回归分析一元线性回归分析例例10-210-2 近年来国家教育部决定将各高校的近年来国家教育部决定将各高校的后勤社会化。某从事饮食业的企业家认为这后勤社会化。某从事饮食业的企业家认为这是一个很好的投资机会,他得到是一个很好的投资机会,他得到1010组高校学组高校学生人数与周边饭店的季营业额的数据,并想生人

19、数与周边饭店的季营业额的数据,并想根据高校的学生人数决策其投资规模。根据高校的学生人数决策其投资规模。第第1010章章 相关相关与回归分析与回归分析Xiang YE, Information School, RUC10.710.7 利用利用ExcelExcel回归分析工具回归分析工具实现多元线性回归分析实现多元线性回归分析例例10-3 10-3 某大学教务处对学生的动手能力颇某大学教务处对学生的动手能力颇感兴趣。在研究中发现学生的学习成绩特别感兴趣。在研究中发现学生的学习成绩特别是统计成绩同计算机有关。他们将学生分成是统计成绩同计算机有关。他们将学生分成两两组组,一,一组组是利用计算机学习统计

20、,另一是利用计算机学习统计,另一组组是不用计算机学习统计。现随机从利用计算是不用计算机学习统计。现随机从利用计算机与不用计算机的学生中抽取两个样本,包机与不用计算机的学生中抽取两个样本,包括统计成绩和过去的绩分点。在显著性水平括统计成绩和过去的绩分点。在显著性水平为为0.050.05时,能否确定使用计算机学生的统计时,能否确定使用计算机学生的统计成绩高于不使用计算机学生的统计成绩?成绩高于不使用计算机学生的统计成绩?菜单:菜单:“工具工具”-“-“数据分析数据分析”,选择,选择“回回归归”1245.3610.8910.04yxx第第1010章章 相关相关与回归分析与回归分析Xiang YE,

21、Information School, RUC10.710.7 利用利用ExcelExcel回归分析工具回归分析工具实现多元线性回归分析实现多元线性回归分析例例10-3 10-3 某大学教务处对学生的动手能力颇感兴趣。某大学教务处对学生的动手能力颇感兴趣。利用求得的多元线性回归方程可知:利用求得的多元线性回归方程可知: (1 1)绩分点()绩分点(x x1 1)对统计成绩()对统计成绩(y y)的影响方向:绩分点()的影响方向:绩分点(x x1 1)正向影响正向影响统计成绩(统计成绩(y y),绩分点(),绩分点(x x1 1)越高,统计成绩()越高,统计成绩(y y)也)也越高;越高; (2

22、 2)绩分点()绩分点(x x1 1)对统计成绩()对统计成绩(y y)的影响程度:)的影响程度:在使用计算机在使用计算机(x x2 2)相同的条件下)相同的条件下,绩分点(,绩分点(x x1 1)每增长)每增长(或减少)(或减少)1 1点,统计点,统计成绩(成绩(y y)平均增长)平均增长(或减少)(或减少)10.8910.89分;分; (3 3)使用计算机()使用计算机(x x2 2)对统计成绩()对统计成绩(y y)的影响方向:使用计算)的影响方向:使用计算机(机(x x2 2)正向影响正向影响统计成绩(统计成绩(y y),使用计算机学习统计,统计成),使用计算机学习统计,统计成绩(绩(y y)就会提高;)就会提高; (4 4)使用计算机()使用计算机(x x2 2)对统计成绩()对统计成绩(y y)的影响程度:)的影响程度:在绩分点在绩分点(x x1 1)相同的条件下)相同的条件下,使用计算机的学生要比那些不使用计算机,使用计算机的学生要比那些不使用计算机的学生的预测分数高出的学生的预测分数高出10.0410.04分,这个分数(分,这个分数(10.0410.04)是计算机对)是计算机对学生统计成绩(学生统计成绩(y y)影响程度的一种度量。)影响程度的一种度量。1245.3610.8910.04yxx

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 教案示例

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁