统计学原理李杰明相关分析幻灯片.ppt

上传人:石*** 文档编号:48325173 上传时间:2022-10-05 格式:PPT 页数:52 大小:2.25MB
返回 下载 相关 举报
统计学原理李杰明相关分析幻灯片.ppt_第1页
第1页 / 共52页
统计学原理李杰明相关分析幻灯片.ppt_第2页
第2页 / 共52页
点击查看更多>>
资源描述

《统计学原理李杰明相关分析幻灯片.ppt》由会员分享,可在线阅读,更多相关《统计学原理李杰明相关分析幻灯片.ppt(52页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、统计学原理李杰明相关分析第1页,共52页,编辑于2022年,星期二第一节第一节 相关分析的意义和任务相关分析的意义和任务 一、相关关系的概念一、相关关系的概念(注意相关关系与函数关系的区别注意相关关系与函数关系的区别)(一一)函数关系函数关系 它它反映着现象之间存在着严格的依存关系,也就反映着现象之间存在着严格的依存关系,也就是具有是具有确定性的对应关系确定性的对应关系,这种关系可用一个数学,这种关系可用一个数学表达式反映出来。表达式反映出来。例例如某种商品的销售额和销售量之间,由于如某种商品的销售额和销售量之间,由于价格因素,所以两者可表现为严格的依存关系。价格因素,所以两者可表现为严格的依

2、存关系。第2页,共52页,编辑于2022年,星期二(二二)相关关系相关关系 它它反映着现象之间的数量上不严格的依存关系,也反映着现象之间的数量上不严格的依存关系,也就是说两者之间就是说两者之间不具有确定性的对应关系不具有确定性的对应关系,这种关系有二个,这种关系有二个明显特点:明显特点:1.1.相关关系是相关关系是现现象之间确实存在数量上的依存关系,象之间确实存在数量上的依存关系,即某一社会经济现象变化要引起另一社会经济现象的即某一社会经济现象变化要引起另一社会经济现象的变化;变化;2.2.现现象之间的这种依存关系是不严格的,即无法用象之间的这种依存关系是不严格的,即无法用数学公式表示。数学公

3、式表示。第3页,共52页,编辑于2022年,星期二商品价格和商品销售量之间,存在着一定的依商品价格和商品销售量之间,存在着一定的依存关系,即商品价格发生变动,商品的销售量也会存关系,即商品价格发生变动,商品的销售量也会随之发生变动。随之发生变动。在在具有相互依存关系的两个变量中,作为根据具有相互依存关系的两个变量中,作为根据的变量称自变量,一般用的变量称自变量,一般用X X表示;发生对应变化的表示;发生对应变化的变量称因变量,一般用变量称因变量,一般用y y表示。表示。例例第4页,共52页,编辑于2022年,星期二二、相关关系的种类二、相关关系的种类 第5页,共52页,编辑于2022年,星期二

4、(一)(一)按按相关关系涉及的因素多少来分,可分为:相关关系涉及的因素多少来分,可分为:单相关和复相关单相关和复相关。在实际工作中,如存在多个自变量,可抓住其中主要的在实际工作中,如存在多个自变量,可抓住其中主要的自变量,研究其相关关系,而保持另一些因素不变,这时复自变量,研究其相关关系,而保持另一些因素不变,这时复相关可转化为相关可转化为偏相关偏相关。(了解)。(了解)二因素之间的相关关系称二因素之间的相关关系称单相关单相关,即只涉及一个自,即只涉及一个自变量和一个因变量变量和一个因变量。三个或三个以上因素的相关关系称三个或三个以上因素的相关关系称复相关复相关,或多元,或多元相关,即涉及二个

5、或二个以上的自变量和因变量相关,即涉及二个或二个以上的自变量和因变量。第6页,共52页,编辑于2022年,星期二(二)(二)按按相关关系的形式来分,可分为:相关关系的形式来分,可分为:直线相关和曲线相关直线相关和曲线相关 直线相关直线相关是指两个相关现象之间,当自变量是指两个相关现象之间,当自变量X X的数值发的数值发生变动时,因变量生变动时,因变量y y随之发生近似于固定比例的变动,在相关图随之发生近似于固定比例的变动,在相关图上的散点近似地表现为直线形式,因此称其为直线相关关系。上的散点近似地表现为直线形式,因此称其为直线相关关系。曲线相关曲线相关是指两个相关现象之间,当自变量是指两个相关

6、现象之间,当自变量X X的的数值发生变动时,因变量数值发生变动时,因变量y y也随之发生变动,但这种变也随之发生变动,但这种变动在数值上不成固定比例,在相关图上的散点可表现动在数值上不成固定比例,在相关图上的散点可表现为抛物线、指数曲线、双曲线等形式,因此称其为曲为抛物线、指数曲线、双曲线等形式,因此称其为曲线相关关系。线相关关系。第7页,共52页,编辑于2022年,星期二(三)(三)按按相关关系的性质来分,可分为相关关系的性质来分,可分为:正相关和负相关正相关和负相关正相关正相关是指两相关现象变化的方向是一致的。是指两相关现象变化的方向是一致的。负相关负相关是指两相关现象变化的方向是相反的。

7、是指两相关现象变化的方向是相反的。第8页,共52页,编辑于2022年,星期二(四)(四)按按相关程度分,可分为:相关程度分,可分为:完全相关、不完全相关和不相关完全相关、不完全相关和不相关 完全相关完全相关就是相关现象之间的关系是完全确定的关就是相关现象之间的关系是完全确定的关系,因而完全相关关系就是函数关系。系,因而完全相关关系就是函数关系。不相关不相关是指两现象之间在数量上的变化上各自独立,是指两现象之间在数量上的变化上各自独立,互不影响。互不影响。不完全相关不完全相关就是介于完全相关和不相关之间的一种相就是介于完全相关和不相关之间的一种相关关系。相关分析的对象主要是不完全相关关系。关关系

8、。相关分析的对象主要是不完全相关关系。第9页,共52页,编辑于2022年,星期二三、相关分析的主要内容三、相关分析的主要内容 相关分析的主要内容,概括起来是五个方面:相关分析的主要内容,概括起来是五个方面:(一)(一)确定现象之间有无关系,以及相关关确定现象之间有无关系,以及相关关系的表现形式系的表现形式;(二)(二)确确定相关关系的密切程度;定相关关系的密切程度;(三)选择合适的数学模型(三)选择合适的数学模型;(四)测定变量估计值的可靠程度;(四)测定变量估计值的可靠程度;(五)对计算出的相关系数,进行显著检验。(五)对计算出的相关系数,进行显著检验。第10页,共52页,编辑于2022年,

9、星期二第二节第二节 简单线性相关分析简单线性相关分析 一、相关表和相关图一、相关表和相关图相关图,也称散布图相关图,也称散布图(或散点图或散点图)。第11页,共52页,编辑于2022年,星期二某市某市19981998年年 2005 2005年的工资性现金支出与城镇储蓄存款余额年的工资性现金支出与城镇储蓄存款余额的资料,说明简单相关表和相关图的编制方法。的资料,说明简单相关表和相关图的编制方法。(简单相关表)(简单相关表)序号序号年份年份工资性工资性现金支出现金支出(万元万元)x城镇储蓄存城镇储蓄存款余额款余额(万万元元)y11998 50012021999 54014032000 620150

10、42001 73020052002 90028062003 97035072004 105045082005 1170510例例1 1第12页,共52页,编辑于2022年,星期二第13页,共52页,编辑于2022年,星期二企业按销售额分组企业按销售额分组(万元万元)流通费用率流通费用率(%)4以下以下9.65 4 87.68 8 127.2512 167.0016 206.8620 246.7324 286.6428 326.6032 366.58例例2 2(分组相关表)(单变量分组相关表)(分组相关表)(单变量分组相关表)(双变量分组相关表(双变量分组相关表:表表7-4p351)第14页,共

11、52页,编辑于2022年,星期二二、相关系数的测定与应用二、相关系数的测定与应用 相关系数相关系数是在直线相关条件下,表明两个现是在直线相关条件下,表明两个现象之间相关关系的方向和密切程度的综合性指标。象之间相关关系的方向和密切程度的综合性指标。一般用符号一般用符号r r表示。表示。第15页,共52页,编辑于2022年,星期二r r的测定方法:的测定方法:第16页,共52页,编辑于2022年,星期二仍以上例仍以上例1 1资料计算:资料计算:序序号号年年份份x(万元万元)y(万元万元)11998 500120-310-155 96100 240254805021999 540140-270-13

12、5 72900 182253645032000 620150-190-125 36100 156252375042001 730200 -80 -75 6400 5625 600052002 900280 90 5 8100 25 45062003 970350 160 75 25600 562512000720041050450 240175 57600 3062542000820051170510 360235129600 5522584600合计合计6480 2200-432400155000 253300第17页,共52页,编辑于2022年,星期二经过计算,表明该市工资性现金支出与城镇

13、储蓄经过计算,表明该市工资性现金支出与城镇储蓄存款余额之间存在着高度正相关。存款余额之间存在着高度正相关。第18页,共52页,编辑于2022年,星期二(二)相关系数简捷计算方法(二)相关系数简捷计算方法 第19页,共52页,编辑于2022年,星期二资料计算如下:资料计算如下:序号序号年份年份x(万元万元)y(万元万元)x2y2xy11998 500120 250000 14400 6000021999 540140 291600 19600 7500032000 620150 384400 22500 9300042001 730200 532900 4000014600052002 9002

14、80 810000 7840025200062003 970350 94090012250033950072004105045011025002025004725008200511705101368900260100596700合计合计6480 22005681200760000 2035300第20页,共52页,编辑于2022年,星期二第21页,共52页,编辑于2022年,星期二对对r r的解释如下:的解释如下:(即即r r的特点的特点)(1)(1)r r取正值或负值决定于分子协方差;取正值或负值决定于分子协方差;(2)(2)r r的绝对值,在的绝对值,在0 0与与1 1之间;之间;(3)(

15、3)r r的绝对值大小,可说明现象之间相关关的绝对值大小,可说明现象之间相关关系的紧密程度。系的紧密程度。三、相关系数的密切程度三、相关系数的密切程度 第22页,共52页,编辑于2022年,星期二简单线性相关分析的特点简单线性相关分析的特点 通过对通过对r r的计算方法的讨论,可看出二个明显特点:的计算方法的讨论,可看出二个明显特点:2.2.相相关关系中只能计算出一个相关系数关关系中只能计算出一个相关系数r r。1.1.相相关关系中,两个变量不必定出哪个是自变关关系中,两个变量不必定出哪个是自变量,哪个是因变量,因此,相关的两个变量量,哪个是因变量,因此,相关的两个变量都是随机变量;都是随机变

16、量;第23页,共52页,编辑于2022年,星期二(一)单变量分组表计算相关系数(一)单变量分组表计算相关系数 四、分组表计算的相关系数四、分组表计算的相关系数(二)双变量分组表计算相关系数(了解,(二)双变量分组表计算相关系数(了解,p355p355)第24页,共52页,编辑于2022年,星期二五、相关系数的显著性检验(了解,五、相关系数的显著性检验(了解,p355-358p355-358)r的显著性检验:即检验的显著性检验:即检验r是否等于是否等于0。第25页,共52页,编辑于2022年,星期二第三节第三节 直线回归分析直线回归分析 在在回归分析中,两个变量之间的回归称为简回归分析中,两个变

17、量之间的回归称为简单回归,两个以上变量之间的回归称为复回归。无单回归,两个以上变量之间的回归称为复回归。无论是简单回归还是复回归,数学模型均有线性论是简单回归还是复回归,数学模型均有线性(直直线线)回归和非线性回归和非线性(曲线曲线)回归之分。回归之分。第26页,共52页,编辑于2022年,星期二(一)简单直线回归分析的特点(一)简单直线回归分析的特点 2.2.在两个互为根据时,可以有两个回归方程。在两个互为根据时,可以有两个回归方程。y yc c=a+bx =a+bx 称称y y倚倚x x回归直线回归直线x xc c=c+dy =c+dy 称称x x倚倚y y回归直线回归直线1.1.在回归分

18、析时,必须根据研究目的,具体确在回归分析时,必须根据研究目的,具体确定定哪个是自变量,哪个是因变量。哪个是自变量,哪个是因变量。一、简单直线回归分析一、简单直线回归分析3.3.回归分析方程的主要作用回归分析方程的主要作用在于给出自变量的在于给出自变量的数值来估计因变量的可能值。数值来估计因变量的可能值。第27页,共52页,编辑于2022年,星期二(二)简单直线回归方程的确定二)简单直线回归方程的确定1.1.基本方法基本方法简简单直线回归方程的一般形式为:单直线回归方程的一般形式为:y yc c=a+bx=a+bx y yc c 因变量的估计值;因变量的估计值;x x 自变量;自变量;a a 回

19、归直线在回归直线在y y轴上的截距;轴上的截距;b b 回归直线的斜率,称回归系数回归直线的斜率,称回归系数,表明表明x x每增加每增加 一个单位,因变量一个单位,因变量y yc c的平均变化值的平均变化值 b0b0,x x与与y y为正相关为正相关 b0b0,x x与与y y为负相关为负相关第28页,共52页,编辑于2022年,星期二 a a、b b的确定:的确定:在在简单直线回归方程中,简单直线回归方程中,a a、b b为待定系数,常用最小平为待定系数,常用最小平方法来确定,即方法来确定,即(y-y(y-yc c)2=最小值。最小值。第29页,共52页,编辑于2022年,星期二简单直线回归

20、方程建立的步骤为:简单直线回归方程建立的步骤为:确确定自变量定自变量x x和因变量和因变量y y;计计算算x x2、xyxy、xx、yy、xx2、xyxy;代代入公式,先求入公式,先求b b,再求,再求a a。2.2.简单直线回归方程的计算简单直线回归方程的计算第30页,共52页,编辑于2022年,星期二仍用上例仍用上例1 1资料得到:资料得到:y yc c=-199.5+0.5858x=-199.5+0.5858x表明该市工资性现金支出每增加表明该市工资性现金支出每增加1 1万元,储蓄存万元,储蓄存款余额就增加款余额就增加0.58580.5858万元。万元。第31页,共52页,编辑于2022

21、年,星期二举例说明举例说明b(b(回归系数回归系数)在经济管理中的作用:在经济管理中的作用:某企业的某种产品月产量与单位成本的关系呈直线某企业的某种产品月产量与单位成本的关系呈直线关系,用直线回归方程表示是:关系,用直线回归方程表示是:y yc c=77.36-1.818x=77.36-1.818x,其中,其中,x x表示月产量表示月产量(千件千件)y y表示单位成本表示单位成本(元元););a=77.36(a=77.36(元元),表示生产这种产品在单位成本,表示生产这种产品在单位成本方面的条件;方面的条件;b=-1.818b=-1.818,表示月产品每增加,表示月产品每增加10001000件

22、,单位件,单位成本平均降低成本平均降低1.8181.818元。元。第32页,共52页,编辑于2022年,星期二(三)判定系数(三)判定系数(p361-364p361-364)判定系数是测定回归方程拟合优度的一个重要指标。判定系数是测定回归方程拟合优度的一个重要指标。第33页,共52页,编辑于2022年,星期二(四)估计标准误差(四)估计标准误差 估计标准误差的概念和作用估计标准误差的概念和作用估计标准误差估计标准误差就是用来说明回归方程推算结就是用来说明回归方程推算结果的准确程度的统计分析指标。以绝对值表示,其果的准确程度的统计分析指标。以绝对值表示,其数值越小,说明推算结果的准确程度越高,回

23、归直数值越小,说明推算结果的准确程度越高,回归直线的代表性也越大。线的代表性也越大。用用S Syxyx表示,也可用表示,也可用S Sy y表示。表示。第34页,共52页,编辑于2022年,星期二估计标准误差的两种计算方法估计标准误差的两种计算方法 1.根据因变量实际值和估计值的离差计算根据因变量实际值和估计值的离差计算:第35页,共52页,编辑于2022年,星期二仍用前例资料计算Sy:第36页,共52页,编辑于2022年,星期二(五)线性回归方程的显著性检验(了解,(五)线性回归方程的显著性检验(了解,p365-367)第37页,共52页,编辑于2022年,星期二二、多元线性回归分析二、多元线

24、性回归分析 多多元线性回归分析可以看作是一元线性回归元线性回归分析可以看作是一元线性回归分析的扩展。现以二元线性回归模型进行回归分分析的扩展。现以二元线性回归模型进行回归分析,其方程式为:析,其方程式为:(一)多元线性回归方程(一)多元线性回归方程第38页,共52页,编辑于2022年,星期二第39页,共52页,编辑于2022年,星期二 以我国以我国1973197319831983年年1111年手表价格和手表销售量的实际资年手表价格和手表销售量的实际资料为例,拟合一元线性回归方程为:料为例,拟合一元线性回归方程为:y yc c=9643-65x=9643-65x此时,回归系数此时,回归系数b b

25、表明,手表平均价格每降低表明,手表平均价格每降低1 1元元/只,销售只,销售量约平均增长量约平均增长6565万只。一元线性回归模型只列入了手表平均万只。一元线性回归模型只列入了手表平均价格对销售量的影响,而忽略了居民收入这一很重要的因素,价格对销售量的影响,而忽略了居民收入这一很重要的因素,因此,现对此资料补入同期居民人均货币收入资料,将原来的因此,现对此资料补入同期居民人均货币收入资料,将原来的一元线性回归模型扩展为二元线性回归模型进行回归分析。一元线性回归模型扩展为二元线性回归模型进行回归分析。例例第40页,共52页,编辑于2022年,星期二列成计算表如下:列成计算表如下:年份年份(n=1

26、1)手表销售量手表销售量y(万只万只)人均货币人均货币收入收入x1(元元)手表平均手表平均价格价格x2(元元/只只)x1yx2yx1x21973 650.4102.113466405.8487153.613681.41974 758.4105.313479859.52101625.614110.21975 819.9110.112990270.99105767.114202.91976 1051.7113.9131119788.63137772.714920.91977 1149.7120.4127148423.88146011.915290.81978 1388.1131.012518184

27、1.10173512.516375.01979 1944.4157.0123305270.80239161.219311.01980 2534.0193.5123490329.00311682.023800.51981 2890.0210.2114607478.00329460.023962.81982 3576.0228.7 89817831.20318264.020354.31983 3898.0258.7 861008412.60335228.022248.2合计合计20660.61730.9 13153905911.562285638.6198258.0第41页,共52页,编辑于202

28、2年,星期二年份年份(n=11)197310 424.4117 956197411 088.0917 956197512 122.0116 641197612 973.2117 161197714 496.1616 129197817 161.0015 625197924 649.0015 129198037 442.2515 129198144 184.0412 996198252 303.697 921198366 925.697 396合计合计303 769.55160 039续表续表第42页,共52页,编辑于2022年,星期二第43页,共52页,编辑于2022年,星期二b b1 1表明

29、在手表平均价格固定时,人均货币收入每增加表明在手表平均价格固定时,人均货币收入每增加元,手表销售量平均增长元,手表销售量平均增长18.636818.6368万只;万只;b b2 2表明在人均货币收入固定时,手表平均价格每上升表明在人均货币收入固定时,手表平均价格每上升元元/只,手表销售量平均减少只,手表销售量平均减少8.03288.0328万只。万只。这里的这里的b b2 2比原一元线性回归模型中的同一回归系数比原一元线性回归模型中的同一回归系数b=-65b=-65要要大得多,是因为一元线性回归模型只列入了手表平均价格对销售大得多,是因为一元线性回归模型只列入了手表平均价格对销售量的影响而忽略

30、了居民收入这一很重要的因素,在手表平均价格量的影响而忽略了居民收入这一很重要的因素,在手表平均价格的影响中渗入了居民收入的影响。的影响中渗入了居民收入的影响。第44页,共52页,编辑于2022年,星期二上面的方法推广到多个自变量,其回归方程为:上面的方法推广到多个自变量,其回归方程为:第45页,共52页,编辑于2022年,星期二(二)多元线性回归模型的判定系数和估计标准误差二)多元线性回归模型的判定系数和估计标准误差(了解,(了解,p370-371p370-371)第46页,共52页,编辑于2022年,星期二 拟合方法拟合方法:统计上通常采用变量代换法把非线性:统计上通常采用变量代换法把非线性

31、形式转换为线性形式处理,使线性回归分析的方法形式转换为线性形式处理,使线性回归分析的方法也能适用于非线性回归问题的研究。也能适用于非线性回归问题的研究。第四节第四节 曲线回归分析曲线回归分析 第47页,共52页,编辑于2022年,星期二一、指数曲线回归模型(一、指数曲线回归模型(p371-375p371-375)二、二次曲线回归模型二、二次曲线回归模型(p375-377p375-377)三、双曲线回归模型三、双曲线回归模型(p377-379p377-379)第48页,共52页,编辑于2022年,星期二 某商店各个时期的商品流通费率和商品零售额资料如下:某商店各个时期的商品流通费率和商品零售额资

32、料如下:x商品零售额商品零售额(万元万元)9.511.513.515.517.519.521.523.525.527.5y商品流通费率商品流通费率(%)6.0 4.6 4.0 3.2 2.8 2.5 2.4 2.3 2.2 2.1散点图显示出散点图显示出x x与与y y的变动关系为一条递减的双曲线。经济理论和实际经验都可的变动关系为一条递减的双曲线。经济理论和实际经验都可说明,流通费率决定于商品零售额,体现着经营的规模效益。说明,流通费率决定于商品零售额,体现着经营的规模效益。例例第49页,共52页,编辑于2022年,星期二双曲线方程为:双曲线方程为:9.56.00.1050.011030.6

33、311.54.60.0870.007560.4013.54.00.0740.005490.3015.53.20.0650.004160.2117.52.80.0570.003270.1619.52.50.0510.002630.1321.52.40.0470.002160.1123.52.30.0430.001810.1025.52.20.0390.001540.0927.52.10.0360.001320.08合计合计 32.10.6040.040972.21第50页,共52页,编辑于2022年,星期二第51页,共52页,编辑于2022年,星期二End of Chapter 7第52页,共52页,编辑于2022年,星期二

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 大学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁