第八章相关与回归分析(学生版).ppt

上传人:得****1 文档编号:76345076 上传时间:2023-03-09 格式:PPT 页数:84 大小:606.50KB
返回 下载 相关 举报
第八章相关与回归分析(学生版).ppt_第1页
第1页 / 共84页
第八章相关与回归分析(学生版).ppt_第2页
第2页 / 共84页
点击查看更多>>
资源描述

《第八章相关与回归分析(学生版).ppt》由会员分享,可在线阅读,更多相关《第八章相关与回归分析(学生版).ppt(84页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、1-1-1 1MBAMBA基础课程基础课程开篇案例:道琼斯下摆理论开篇案例:道琼斯下摆理论分析人员发现股票价格和裙子长度相一致分析人员发现股票价格和裙子长度相一致纽约纽约时装的秋季集中展示会暗示股票的时装的秋季集中展示会暗示股票的秋季回落吗?据六大股市指示器秋季回落吗?据六大股市指示器“下摆指示下摆指示器器”所示,当裙子的下摆变短,则股票会涨所示,当裙子的下摆变短,则股票会涨起来,当裙长接近地面时,股票就会下跌。起来,当裙长接近地面时,股票就会下跌。从路上那些及踝长裙来判断,在从路上那些及踝长裙来判断,在1010月的某个月的某个时候股票会有所下跌,而此时正是这种端庄时候股票会有所下跌,而此时正

2、是这种端庄的时装充斥大街的时候。的时装充斥大街的时候。1-1-2 2MBAMBA基础课程基础课程开篇案例:道琼斯下摆理论开篇案例:道琼斯下摆理论“我不会把我所有的股市判断都立足于这种我不会把我所有的股市判断都立足于这种理论,但这是一种有趣的相关关系。理论,但这是一种有趣的相关关系。”审慎审慎安全公司技术分析主任拉尔夫阿坎泊拉说道。安全公司技术分析主任拉尔夫阿坎泊拉说道。在喧啸的二十世纪在喧啸的二十世纪2020年代,短的宽平下垂的年代,短的宽平下垂的裙装风行一时。裙装风行一时。3030年代的长式时装宣告了熊年代的长式时装宣告了熊市的到来。与此相似,在市的到来。与此相似,在6060年代,股票的上年

3、代,股票的上涨与超短迷你裙的流行相吻合。只是在涨与超短迷你裙的流行相吻合。只是在7070年年代才让位于石油危机、通货膨胀和更加保守代才让位于石油危机、通货膨胀和更加保守的裙长。甚至的裙长。甚至“查理的天使查理的天使”也穿着长裙。也穿着长裙。1-1-3 3MBAMBA基础课程基础课程开篇案例:道琼斯下摆理论开篇案例:道琼斯下摆理论那么在飞速发展的那么在飞速发展的8080年代怎么样的呢?妇女职年代怎么样的呢?妇女职业装是宽肩配以短小的裙子。在业装是宽肩配以短小的裙子。在19871987年股票狂年股票狂跌,裙摆也在不断变长。到了今天,极端疯狂跌,裙摆也在不断变长。到了今天,极端疯狂的牛市也使裙子越变

4、越短的牛市也使裙子越变越短还要开衩。还要开衩。阿坎泊拉先生摒除了女式的时装是一种领导或阿坎泊拉先生摒除了女式的时装是一种领导或是一个指示器,说时装的下摆是随股票变化的是一个指示器,说时装的下摆是随股票变化的“因为当人们赚钱的时候就会有一些放荡,这因为当人们赚钱的时候就会有一些放荡,这是心理方面的因素。是心理方面的因素。”1-1-4 4MBAMBA基础课程基础课程开篇案例:道琼斯下摆理论开篇案例:道琼斯下摆理论当最近在美国和欧洲举行的秋季时装展示会当最近在美国和欧洲举行的秋季时装展示会上众多品牌如乔治奥上众多品牌如乔治奥阿马尼、拉尔夫阿马尼、拉尔夫劳劳伦和奥斯卡伦和奥斯卡德德拉拉兰塔以长裙、长裙

5、装兰塔以长裙、长裙装为特色时,对股票来讲情况又变糟了。为特色时,对股票来讲情况又变糟了。新的下摆外观与华尔街上发生的某些事相似新的下摆外观与华尔街上发生的某些事相似已经被预言了。从已经被预言了。从19951995年至年至19971997年,股票有年,股票有3 3年涨幅大于年涨幅大于2020个百分点。但是类似的走势却个百分点。但是类似的走势却没有延至第四年。没有延至第四年。1-1-5 5MBAMBA基础课程基础课程开篇案例:道琼斯下摆理论开篇案例:道琼斯下摆理论理查德麦克凯博,墨里尔&林奇公司的市场分析负责人甚至预言今年的某些时候,股票价格会下降25个百分点。但是理查德麦克凯博不承认这与裙摆有任

6、何相互关系,“我从没有把它当作股市指示器”他说道,并强调他决不是个专看女人裙子的人。移动运营商价值创造过程移动运营商价值创造过程1-1-6 6MBAMBA基础课程基础课程第八章第八章 相关与回归分析相关与回归分析第一节第一节 相关分析相关分析 第二节第二节 一元线性回归分析一元线性回归分析第三节第三节 多元线性回归分析多元线性回归分析第四节第四节 可线性化的非线性回归分析可线性化的非线性回归分析1-1-7 7MBAMBA基础课程基础课程第一节第一节 相关分析相关分析一一.变量相关的概念变量相关的概念二二.相关系数及其计算相关系数及其计算1-1-8 8MBAMBA基础课程基础课程变量相关的概念变

7、量相关的概念1-1-9 9MBAMBA基础课程基础课程变量间的关系变量间的关系(函数关系)(函数关系)1.是一一对应的确定关系是一一对应的确定关系2.设设有有两两个个变变量量 x x 和和 y y,变变量量 y y 随随变变量量 x x 一一起起变变化化,并并完完全全依依赖赖于于 x x ,当当变变量量 x x 取取某某个个数数值值时时,y y 依依确确定定的的关关系系取取相相应应的的值值,则则称称 y y 是是 x x 的的函函数数,记记为为 y y =f f(x x),其其中中 x x 称为自变量,称为自变量,y y 称为因变量称为因变量3.各观测点落在一条线上各观测点落在一条线上 x x

8、y y1-1-1010MBAMBA基础课程基础课程变量间的关系变量间的关系(函数关系)(函数关系)函数关系的例子某某种种商商品品的的销销售售额额(y y)与与销销售售量量(x x)之之间间的的关系可表示为关系可表示为 y y=p p x x(p p 为单价为单价)圆圆的的面面积积(S)(S)与与半半径径之之间间的的关关系系可可表表示示为为S S=R R2 2 企企业业的的原原材材料料消消耗耗额额(y y)与与产产量量(x x1 1)、单单位位产产量量消消耗耗(x x2 2)、原原材材料料价价格格(x x3 3)之之间间的的关关系系可可表示为表示为y y=x x1 1 x x2 2 x x3 3

9、 1-1-1111MBAMBA基础课程基础课程变量间的关系变量间的关系(相关关系)(相关关系)1.变变量量间间关关系系不不能能用用函函数数关关系精确表达系精确表达2.一一个个变变量量的的取取值值不不能能由由另另一个变量唯一确定一个变量唯一确定3.当当变变量量 x x 取取某某个个值值时时,变变量量 y y 的取值可能有几个的取值可能有几个4.各各观观测测点点分分布布在在一一条条线线周周围围 x xy y1-1-1212MBAMBA基础课程基础课程变量间的关系变量间的关系(相关关系)(相关关系)相关关系的例子商商品品的的消消费费量量(y y)与与居居民民收收入入(x x)之之间间的的关关系系商商

10、品品销销售售额额(y y)与与广广告告费费支支出出(x x)之之间间的的关关系系收入水平收入水平(y y)与受教育程度与受教育程度(x x)之间的关系之间的关系父亲身高父亲身高(y y)与子女身高与子女身高(x x)之间的关系之间的关系1-1-1313MBAMBA基础课程基础课程相关关系的例子相关关系的例子中国移动通信市场的竞争中国移动通信市场的竞争今年以来,有两个迹象表明中国移动通信行业竞今年以来,有两个迹象表明中国移动通信行业竞争加剧。一是市场竞争从对增量用户的竞争争加剧。一是市场竞争从对增量用户的竞争转向对存量用户的争夺。转向对存量用户的争夺。20012001年,移动和联年,移动和联通每

11、月净增用户的走势表现出相当强的趋同通每月净增用户的走势表现出相当强的趋同性,基本上是随着季节因素同上同下。但从性,基本上是随着季节因素同上同下。但从今年前九个月的数据来看,两家运营商每月今年前九个月的数据来看,两家运营商每月净增用户的升降表现出很强的负相关性,这净增用户的升降表现出很强的负相关性,这表明总增量用户的增长放缓,移动和联通对表明总增量用户的增长放缓,移动和联通对存量用户的竞争加剧。据不完全统计,存量用户的竞争加剧。据不完全统计,CDMACDMA新增用户中,有新增用户中,有50%-60%50%-60%是中国移动的是中国移动的“全全球通球通”用户。二是手机补贴方式大规模推出。用户。二是

12、手机补贴方式大规模推出。1-1-1515MBAMBA基础课程基础课程相关关系的类型相关关系的类型相关关系相关关系非线性相关非线性相关线性相关线性相关正正相相关关正正相相关关负负相相关关负负相相关关完全相关完全相关不相关不相关1-1-1616MBAMBA基础课程基础课程相关关系的图示相关关系的图示 不相关不相关不相关不相关不相关不相关 负线性相关负线性相关负线性相关负线性相关负线性相关负线性相关 正线性相关正线性相关正线性相关正线性相关正线性相关正线性相关 非线性相关非线性相关非线性相关非线性相关非线性相关非线性相关 完全负线性相关完全负线性相关完全负线性相关完全负线性相关完全负线性相关完全负线

13、性相关完全正线性相关完全正线性相关完全正线性相关完全正线性相关完全正线性相关完全正线性相关 1-1-1717MBAMBA基础课程基础课程相关系数及其计算相关系数及其计算1-1-1818MBAMBA基础课程基础课程相关关系的测度相关关系的测度(相关系数)(相关系数)1.对变量之间关系密切程度的度量2.对两个变量之间线性相关程度的度量称为简单相关系数3.若相关系数是根据总体全部数据计算的,称为总体相关系数,记为 4.若是根据样本数据计算的,则称为样本相关系数,记为 r1-1-1919MBAMBA基础课程基础课程相关关系的测度相关关系的测度(相关系数)(相关系数)样本相关系数的计算公式或表示为:1-

14、1-2020MBAMBA基础课程基础课程相关关系的测度相关关系的测度(相关系数取值及其意义)(相关系数取值及其意义)1.r r 的取值范围是的取值范围是 -1,1-1,12.|r r|=1|=1,为完全相关为完全相关n nr r=1=1,为完全正相关,为完全正相关n nr r=-1=-1,为完全负正相关,为完全负正相关3.r r=0=0,不存在不存在线性线性相关相关关系相关关系相关4.-1-1 r r00,为负相关为负相关5.0 0 t t,拒绝,拒绝H H0 0 若若 t t =11.3t t(31-2)=2.045(31-2)=2.045,拒绝,拒绝H H0 0,邮政业务收邮政业务收入和社

15、会消费品零售总额之间入和社会消费品零售总额之间的相关关系显著的相关关系显著1-1-2626MBAMBA基础课程基础课程第二节第二节 一元线性回归一元线性回归一一.一元线性回归模型一元线性回归模型二二.参数的最小二乘估计参数的最小二乘估计三三.回归方程的显著性检验回归方程的显著性检验1-1-2727MBAMBA基础课程基础课程什么是回归分析?什么是回归分析?(内容)(内容)1.从一组样本数据出发,确定变量之间的数学关系式2.对这些关系式的可信程度进行各种统计检验,并从影响某一特定变量的诸多变量中找出哪些变量的影响显著,哪些不显著3.利用所求的关系式,根据一个或几个变量的取值来预测或控制另一个特定

16、变量的取值,并给出这种预测或控制的精确程度1-1-2828MBAMBA基础课程基础课程趋向中间高度的回归回归这个术语是由英国著名统计学家回归这个术语是由英国著名统计学家Francis GaltonFrancis Galton在在1919世纪末期研究孩子及他们的父母的身高时提世纪末期研究孩子及他们的父母的身高时提出来的。出来的。GaltonGalton发现身材高的父母,他们的孩子发现身材高的父母,他们的孩子也高。但这些孩子平均起来并不像他们的父母那也高。但这些孩子平均起来并不像他们的父母那样高。对于比较矮的父母情形也类似:他们的孩样高。对于比较矮的父母情形也类似:他们的孩子比较矮,但这些孩子的平

17、均身高要比他们的父子比较矮,但这些孩子的平均身高要比他们的父母的平均身高高。母的平均身高高。GaltonGalton把这种孩子的身高向中把这种孩子的身高向中间值靠近的趋势称之为一种回归效应,而他发展间值靠近的趋势称之为一种回归效应,而他发展的研究两个数值变量的方法称为回归分析。的研究两个数值变量的方法称为回归分析。1-1-2929MBAMBA基础课程基础课程回归分析与相关分析的区别回归分析与相关分析的区别1.相相关关分分析析中中,变变量量 x x 变变量量 y y 处处于于平平等等的的地地位位;回回归归分分析析中中,变变量量 y y 称称为为因因变变量量,处处在在被被解解释释的的地地位,位,x

18、 x 称为自变量,用于预测因变量的变化称为自变量,用于预测因变量的变化2.相相关关分分析析中中所所涉涉及及的的变变量量 x x 和和 y y 都都是是随随机机变变量量;回回归归分分析析中中,因因变变量量 y y 是是随随机机变变量量,自自变变量量 x x 可可以是随机变量,也可以是非随机的确定变量以是随机变量,也可以是非随机的确定变量3.相相关关分分析析主主要要是是描描述述两两个个变变量量之之间间线线性性关关系系的的密密切切程程度度;回回归归分分析析不不仅仅可可以以揭揭示示变变量量 x x 对对变变量量 y y 的影响大小,还可以揭示变量之间确切的关系的影响大小,还可以揭示变量之间确切的关系1

19、-1-3030MBAMBA基础课程基础课程回归模型的类型回归模型的类型一个自变量一个自变量两个及两个以上自变量两个及两个以上自变量回归模型回归模型多元回归多元回归一元回归一元回归线性线性回归回归非线性非线性回归回归线性线性回归回归非线性非线性回归回归1-1-3131MBAMBA基础课程基础课程回归模型与回归方程回归模型与回归方程1-1-3232MBAMBA基础课程基础课程回归模型回归模型1.回答“变量之间是什么样的关系?”2.方程中运用n n1 1 个数字的因变量个数字的因变量(响应变量响应变量)l l被预测的变量被预测的变量n n1 1 个或多个数字的或分类的自变量个或多个数字的或分类的自变

20、量 (解释变量解释变量)l l用于预测的变量用于预测的变量3.主要用于预测和估计1-1-3333MBAMBA基础课程基础课程一元线性回归模型一元线性回归模型(概念要点)(概念要点)1.当只涉及一个自变量时称为一元回归,若因变量 y 与自变量 x 之间为线性关系时称为一元线性回归2.对于具有线性关系的两个变量,可以用一条线性方程来表示它们之间的关系3.描述因变量 y 如何依赖于自变量 x 和误差项 的方程称为回归模型1-1-3434MBAMBA基础课程基础课程一元线性回归模型一元线性回归模型(概念要点)(概念要点)对于只涉及一个自变量的简单线性回归模型可表示为 y=0 0+1 1 x+e en

21、n模型中,模型中,y y 是是 x x 的线性函数的线性函数(部分部分)加上误差项加上误差项n n线性部分反映了由于线性部分反映了由于 x x 的变化而引起的的变化而引起的 y y 的变化的变化n n误差项误差项 是随机变量是随机变量l l反反映映了了除除 x x 和和 y y 之之间间的的线线性性关关系系之之外外的的随随机机因因素素对对 y y 的影响的影响l l是不能由是不能由 x x 和和 y y 之间的线性关系所解释的变异性之间的线性关系所解释的变异性n n 0 0 和和 1 1 称为模型的参数称为模型的参数1-1-3535MBAMBA基础课程基础课程一元线性回归模型一元线性回归模型(

22、基本假定)(基本假定)1.误误差差项项 是是一一个个期期望望值值为为0 0的的随随机机变变量量,即即E E()=0)=0。对对于于一一个个给给定定的的 x x 值值,y y 的的期期望望值值为为E E (y y)=0 0+1 1 x x2.对于所有的对于所有的 x x 值,值,的方差的方差 2 2 都相同都相同3.误误差差项项 是是一一个个服服从从正正态态分分布布的的随随机机变变量量,且且相相互独立。即互独立。即 N N(0,(0,2 2)n n独独立立性性意意味味着着对对于于一一个个特特定定的的 x x 值值,它它所所对对应应的的 与与其他其他 x x 值所对应的值所对应的 不相关不相关n

23、n对对于于一一个个特特定定的的 x x 值值,它它所所对对应应的的 y y 值值与与其其他他 x x 所所对应的对应的 y y 值也不相关值也不相关1-1-3636MBAMBA基础课程基础课程回归方程回归方程(概念要点)(概念要点)1.描述 y 的平均值或期望值如何依赖于 x 的方程称为回归方程回归方程2.简单线性回归方程的形式如下3.E(y)=0+1 x方程的图示是一条直线,因此也称为直线回归方程方程的图示是一条直线,因此也称为直线回归方程 0 0是是回回归归直直线线在在 y y 轴轴上上的的截截距距,是是当当 x x=0=0 时时 y y 的的期期望值望值 1 1是是直直线线的的斜斜率率,

24、称称为为回回归归系系数数,表表示示当当 x x 每每变变动动一个单位时,一个单位时,y y 的平均变动值的平均变动值1-1-3737MBAMBA基础课程基础课程估计估计(经验经验)的回归的回归方程方程3.简单线性回归中估计的回归方程为简单线性回归中估计的回归方程为其其中中:是是估估计计的的回回归归直直线线在在 y y 轴轴上上的的截截距距,是是直直线线的斜率,表示的斜率,表示 x x 每变动一个单位时,每变动一个单位时,y y 的平均变动值的平均变动值 2.用用样样本本统统计计量量 和和 代代替替回回归归方方程程中中的的未未知知参参数数 和和 ,就就得得到到了了估估计计的的回回归归方方程程(样

25、样本本回回归方程)归方程)1.总总体体回回归归参参数数 和和 是是未未知知的的,必必需需利利用用样样本本数数据去估计据去估计1-1-3838MBAMBA基础课程基础课程参数参数 0 和和 1 的最小二乘估计的最小二乘估计1-1-3939MBAMBA基础课程基础课程最小二乘法最小二乘法(概念要点)(概念要点)1.使因变量的观察值与估计值之间的离差平方和达到最小来求得 和 的方法。即2.用最小二乘法拟合的直线来代表x与y之间的关系与实际数据的误差比其他任何直线都小1-1-4040MBAMBA基础课程基础课程最小二乘法最小二乘法(图示)(图示)x xy y(x xn n,y yn n)(x x1 1

26、,y y1 1)(x x2 2,y y2 2)(x xi i,y yi i)e ei i=y yi i-y yi i1-1-4141MBAMBA基础课程基础课程最小二乘法最小二乘法(和和 的计算公式的计算公式)根据最小二乘法的要求,可得求解 和 的标准方程如下1-1-4242MBAMBA基础课程基础课程估计方程的求法估计方程的求法(实例)(实例)【例例】根据数据,利用最小二乘法建立邮政业务收入对社会消费品零售总额的回归方程1-1-4343MBAMBA基础课程基础课程估计方程的求法估计方程的求法(实例)(实例)邮政业务收入对社会消费品零售总额的回归方程为邮政业务收入对社会消费品零售总额的回归方程

27、为 结论:随着社会消费品零售总额的增加随着社会消费品零售总额的增加,邮政业务收入也邮政业务收入也增加增加,在不考虑其他因素情况下在不考虑其他因素情况下,社会消费品零售总社会消费品零售总额每增加额每增加1亿元亿元,邮政业务收入平均增加邮政业务收入平均增加93.50万元万元 1-1-4444MBAMBA基础课程基础课程估计估计(经验经验)方程方程1-1-4545MBAMBA基础课程基础课程估计方程的求法估计方程的求法(Excel的输出结果)的输出结果)1-1-4646MBAMBA基础课程基础课程回归方程的显著性检验回归方程的显著性检验1-1-4747MBAMBA基础课程基础课程离差平方和的分解离差

28、平方和的分解1.因变量 y 的取值是不同的,y 取值的这种波动称为变差。变差来源于两个方面n n由于自变量由于自变量 x x 的取值不同造成的的取值不同造成的n n除除 x x 以以外外的的其其他他因因素素(如如x x对对y y的的非非线线性性影影响响、测量误差等测量误差等)的影响的影响2.对一个具体的观测值来说,变差的大小可以通过该实际观测值与其均值之差 来表示1-1-4848MBAMBA基础课程基础课程离差平方和的分解离差平方和的分解(图示)(图示)x xy yy y 离差分解图离差分解图1-1-4949MBAMBA基础课程基础课程离差平方和的分解离差平方和的分解(三个平方和的关系)(三个

29、平方和的关系)2.两端平方后求和有1.从图上看有SST=SSR+SSE总变差平方和总变差平方和(SSTSST)回归平方和回归平方和(SSRSSR)残差平方和残差平方和(SSESSE)1-1-5050MBAMBA基础课程基础课程离差平方和的分解离差平方和的分解(三个平方和的意义)(三个平方和的意义)1.总离差平方和总离差平方和(SST)n n反映因变量的反映因变量的 n n 个观察值与其均值的总离差个观察值与其均值的总离差2.回归离差平方和回归离差平方和(SSR)n n反反映映自自变变量量 x x 的的变变化化对对因因变变量量 y y 取取值值变变化化的的影影响响,或或者者说说,是是由由于于 x

30、 x 与与 y y 之之间间的的线线性性关关系系引引起的起的 y y 的取值变化,也称为可解释的平方和的取值变化,也称为可解释的平方和3.剩余离差(残差)平方和剩余离差(残差)平方和(SSE)n n反反映映除除 x x 以以外外的的其其他他因因素素对对 y y 取取值值的的影影响响,也也称为不可解释的平方和或剩余平方和称为不可解释的平方和或剩余平方和1-1-5151MBAMBA基础课程基础课程样本决定系数(可决系数)样本决定系数(可决系数)(判定系数(判定系数 r2)1.回归平方和占总离差平方和的比例2.反映回归直线的拟合程度3.取值范围在 0,1 之间4.r2 1,说明回归方程拟合的越好;r

31、20,说明回归方程拟合的越差5.判定系数等于相关系数的平方,即r2(r)21-1-5252MBAMBA基础课程基础课程样本决定系数(可决系数)样本决定系数(可决系数)(举例判定系数(举例判定系数 r2)【例】求邮政业务收入对社会消费品零售总额回归的可决系数。可决系数为0.8148,也可以说邮政业务收入的总离差中归因于其与社会消费品零售总额之间直线关系的比例为81.48%1-1-5353MBAMBA基础课程基础课程回归方程的显著性检验回归方程的显著性检验(线性关系的检验线性关系的检验)1.检验自变量和因变量之间的线性关系是否显著2.具体方法是将回归离差平方和(SSR)同剩余离差平方和(SSE)加

32、以比较,应用F检验来分析二者之间的差别是否显著如果是显著的,两个变量之间存在线性关系如果是显著的,两个变量之间存在线性关系如果不显著,两个变量之间不存在线性关系如果不显著,两个变量之间不存在线性关系1-1-5454MBAMBA基础课程基础课程回归方程的显著性检验回归方程的显著性检验(检验检验的步骤)的步骤)1.提出假设n nH H0 0:线性关系不显著:线性关系不显著2.计算检验统计量F3.确定显著性水平,并根据分子自由度1和分母自由度n-2找出临界值F 4.作出决策:若FF,拒绝H0;若F t t,拒绝,拒绝H H0 0;t t =11.296t t=2.045=2.045,拒拒绝绝H H0

33、 0,表表明明邮邮政政业业务务收收入入和和社会消费品零售总额社会消费品零售总额之间有显著线性关系之间有显著线性关系对前例的回归系数进行显著性检验(0.05)1-1-6363MBAMBA基础课程基础课程回归系数的显著性检验回归系数的显著性检验(Excel输出的结果)输出的结果)1-1-6464MBAMBA基础课程基础课程常见的非线性模型常见的非线性模型 幂函数2.线性化方法两端取对数得:两端取对数得:log log y y=log=log +loglog x x令:令:y y =log=logy y,x x=log=log x x,则则y y =loglog +x x 1.基本形式:3.图像00

34、 1 1 1 1 =1=1-1-1 0 0 -1-1 =-1=-1 1-1-6565MBAMBA基础课程基础课程预测及应用预测及应用1-1-6666MBAMBA基础课程基础课程利用回归方程利用回归方程进行估计和预测进行估计和预测1.根据自变量根据自变量 x x 的取值估计或预测因变量的取值估计或预测因变量 y y的取值的取值2.估计或预测的类型估计或预测的类型n n点估计点估计l l对于自变量对于自变量 x x 的一个给定值的一个给定值x0 x0,根据回归方程得到,根据回归方程得到因变量因变量 y y 的一个估计值的一个估计值(点估计不能给出估计的精度,点估计不能给出估计的精度,点估计值与实际

35、值之间是有误差的,因此需要进行点估计值与实际值之间是有误差的,因此需要进行区间估计区间估计)n n区间估计区间估计l l对于自变量对于自变量 x x 的一个给定值的一个给定值 x x0 0,根据回归方程得到,根据回归方程得到因变量因变量 y y 的一个估计区间的一个估计区间1-1-6767MBAMBA基础课程基础课程利用回归方程进行估计和预测利用回归方程进行估计和预测(置信区间估计)(置信区间估计)y 的平均值的的平均值的置信区间置信区间估计估计 1.利用估计的回归方程,对于自变量 x 的一个给定值 x0,求出因变量 y 的平均值E(y0)的估计区间,这一估计区间称为置信区间置信区间2.E(y

36、0)在1-置信水平下的置信区间为式式中中:S Sy y为为估估计标准误差计标准误差1-1-6868MBAMBA基础课程基础课程利用回归方程进行估计和预测利用回归方程进行估计和预测(预测区间估计)(预测区间估计)y 的个别值的的个别值的预测区间预测区间估计估计 1.利用估计的回归方程,对于自变量 x 的一个给定值 x0,求出因变量 y 的一个个别值的估计区间,这一区间称为预测区间预测区间 2.y0在1-置信水平下的预测区间为注意!注意!1-1-6969MBAMBA基础课程基础课程利用回归方程进行估计和预测利用回归方程进行估计和预测(置预测区间估计(置预测区间估计:算例)算例)【例例例例】根根据据

37、前前例例,求求出出19901990年年人人均均国国民民收收入入为为1250.71250.7元时,人均消费金额的元时,人均消费金额的95%95%的预测区间的预测区间 解:解:根据前面的计算结果有根据前面的计算结果有 712.57712.57,S Sy y=14.95=14.95,t t(13-2)(13-2)2.2012.201,n n=13=13 置信区间为置信区间为712.57712.57 34.46934.469人人均均消消费费金金额额95%95%的的预预测测区区间间为为678.101678.101元元 747.039747.039元之间元之间1-1-7070MBAMBA基础课程基础课程影

38、响区间宽度的因素影响区间宽度的因素1.置信水平(1-)n n区间宽度随置信水平的增大而增大区间宽度随置信水平的增大而增大2.数据的离散程度(s)n n区间宽度随离散程度的增大而增大区间宽度随离散程度的增大而增大3.样本容量n n区间宽度随样本容量的增大而减小区间宽度随样本容量的增大而减小4.用于预测的 xp与x的差异程度n n区间宽度随区间宽度随 x xp p与与 x x 的差异程度的增大而增大的差异程度的增大而增大1-1-7171MBAMBA基础课程基础课程置信区间置信区间、预测区间预测区间、回归方程回归方程xp pyx x预测上限置信上限预测下限置信下限1-1-7272MBAMBA基础课程

39、基础课程案例案例我们应打出多少广告?我们应打出多少广告?Alfonso Alfonso是一座大城市具有是一座大城市具有6060多年历史由创建者多年历史由创建者家族控制的大公司。近年来营销手段的重心偏向报家族控制的大公司。近年来营销手段的重心偏向报纸广告。为了达到促进即期销售的目标,纸广告。为了达到促进即期销售的目标,AlfonsoAlfonso公司不时在地方报纸上刊登广告。内容包括以低于公司不时在地方报纸上刊登广告。内容包括以低于平时的价格推出商品,或以正常价格重点推荐中低平时的价格推出商品,或以正常价格重点推荐中低价商品。价商品。但是,但是,AlfonsoAlfonso公司的公司的CEOCE

40、O认为表面上的增长并认为表面上的增长并不是真实的增长,因为这类广告只是把一家商店的不是真实的增长,因为这类广告只是把一家商店的销售转移到另一家。为了成功地从顾客的钱包里掏销售转移到另一家。为了成功地从顾客的钱包里掏出钱来,每个登广告的公司都在和竞争对手的公司出钱来,每个登广告的公司都在和竞争对手的公司竞争,而顾客用来消费的钱却只有那么多。竞争,而顾客用来消费的钱却只有那么多。1-1-7373MBAMBA基础课程基础课程案例案例我们应打出多少广告?我们应打出多少广告?要制定报纸广告策略,首先要了解广告的总要制定报纸广告策略,首先要了解广告的总体效果。体效果。问题的研究从收集数据开始。问题的研究从

41、收集数据开始。AlfonsoAlfonso公司有公司有它自己每周销售额的数据,知道自己哪一周刊登它自己每周销售额的数据,知道自己哪一周刊登了报纸广告,也知道每次广告的成本。城市主要了报纸广告,也知道每次广告的成本。城市主要公司(包括公司(包括AlfonsoAlfonso )总销售额可以从政府的统)总销售额可以从政府的统计数据得到。计数据得到。AlfonsoAlfonso公司统计了公司统计了2626周内各主要周内各主要公司刊登的报纸广告,并根据自己在广告费用方公司刊登的报纸广告,并根据自己在广告费用方面的经验以及竞争者们广告的规格和水平估计了面的经验以及竞争者们广告的规格和水平估计了竞争对手的广

42、告成本。竞争对手的广告成本。1-1-7474MBAMBA基础课程基础课程相关关系和因果关系相关关系和因果关系1-1-7575MBAMBA基础课程基础课程古老的谬误古老的谬误人们费尽周折证明抽烟者的大学成绩比不抽烟的差,人们费尽周折证明抽烟者的大学成绩比不抽烟的差,这个结论多次被使用。这个结论多次被使用。如果如果B B紧跟着紧跟着A A出现,那么出现,那么A A 一定导致一定导致B B。当抽烟与。当抽烟与低分同时出现时,人们认为抽烟导致低分。低分同时出现时,人们认为抽烟导致低分。但难道不是相反?也许低分促使学生不喝酒而变得但难道不是相反?也许低分促使学生不喝酒而变得爱抽烟。这种说法与前一种一样得

43、到数据的很好爱抽烟。这种说法与前一种一样得到数据的很好支撑,但不能满足宣传者的要求。支撑,但不能满足宣传者的要求。而更大的可能是两个因素并不互为因果,而同为第而更大的可能是两个因素并不互为因果,而同为第三个因素的产物。三个因素的产物。1-1-7676MBAMBA基础课程基础课程收入和股票谁是因?谁是果?收入和股票谁是因?谁是果?互为因果所有变量互相之间没有任何影响,但却存在显著相关(如抽烟者与低分)1-1-7777MBAMBA基础课程基础课程超过数据范围的相关关系超过数据范围的相关关系雨下得大,谷物长的高,收成也高但暴雨会毁灭庄稼。正相关超过一定数据范围就变为负相关1-1-7878MBAMBA

44、基础课程基础课程上大学对你保持独身有什么上大学对你保持独身有什么影响?影响?如果你是个女孩,它会提高你成为未婚女子的几率。如果你是个女孩,它会提高你成为未婚女子的几率。但如果你是一个男子,结果相反但如果你是一个男子,结果相反它将减少你单身它将减少你单身的机会。的机会。康奈尔大学对康奈尔大学对15001500名毕业生进行了调查。他们中的男名毕业生进行了调查。他们中的男孩孩93%93%已经成婚(同年龄段的比例为已经成婚(同年龄段的比例为83%83%)。但是)。但是女孩中只有女孩中只有65%65%成婚,未婚比例是同年龄段女孩的成婚,未婚比例是同年龄段女孩的3 3倍。倍。这里用了真实的相关关系支持了一

45、个未经证实的因果这里用了真实的相关关系支持了一个未经证实的因果关系。也许相反,这些女孩如果不上大学也同样保关系。也许相反,这些女孩如果不上大学也同样保持独身,说不定数目还会更多。实际上,想保持独持独身,说不定数目还会更多。实际上,想保持独身的性格倾向会促使她们上大学。身的性格倾向会促使她们上大学。1-1-7979MBAMBA基础课程基础课程本章小结本章小结1.相关系数与相关分析相关系数与相关分析2.一一元元线线性性回回归归模模型型、回回归归方方程程与与估估计计的的(样本)回归方程、样本回归模型(样本)回归方程、样本回归模型3.回归方程与回归系数的显著性检验回归方程与回归系数的显著性检验4.用用

46、Excel 进行回归分析进行回归分析1-1-8080MBAMBA基础课程基础课程参考内容参考内容通信管理中的应用统计学第八章商务与经济统计(第7版)第14、15、16章统计学的世界(第5版)第二部分第14、15章1-1-8181MBAMBA基础课程基础课程什么是统计学什么是统计学?1.1.数据搜集:例如,调查与试验数据搜集:例如,调查与试验数据搜集:例如,调查与试验数据搜集:例如,调查与试验2.2.数据整理:例如,分组数据整理:例如,分组数据整理:例如,分组数据整理:例如,分组 3.3.数据展示:例如,数据展示:例如,数据展示:例如,数据展示:例如,图和表图和表图和表图和表4.4.数据分析:例

47、如,回归分析数据分析:例如,回归分析数据分析:例如,回归分析数据分析:例如,回归分析 统统统统计计计计学学学学是是是是一一一一门门门门收收收收集集集集、整整整整理理理理和和和和分分分分析析析析数数数数据据据据的的的的方方方方法法法法科科科科学学学学,其其其其目目目目的的的的是是是是探探探探索索索索数数数数据据据据的的的的内内内内在在在在数数数数量量量量规规规规律律律律性性性性,以以以以达达达达到到到到对对对对客观事物的科学认识客观事物的科学认识客观事物的科学认识客观事物的科学认识1-1-8282MBAMBA基础课程基础课程我们为什么要学统计学?我们为什么要学统计学?1.不用统计数据如何?不用统计数据如何?2.这些数据怎么来的?这些数据怎么来的?3.数据来了怎么处理?数据来了怎么处理?4.数据告诉我们什么?探索数据的内在数量数据告诉我们什么?探索数据的内在数量规律性规律性1-1-8383MBAMBA基础课程基础课程收集数据收集数据第二章统计数据的搜集 描述描述统计统计整理数据整理数据第三章图表法分析数据分析数据第四章数值法第五章抽样与抽样分布 推断推断统计统计第六章参数估计第七章假设检验第八章相关与回归分析 管理中常用的管理中常用的统统计计方法方法1-1-8484MBAMBA基础课程基础课程结结 束束

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > 工作报告

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁