《多元线性回归ppt课件.ppt》由会员分享,可在线阅读,更多相关《多元线性回归ppt课件.ppt(73页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、 经管类经管类 核心课程核心课程统计学统计学经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用第第1212章章 多元线性回归多元线性回归统计学 经管类经管类 核心课程核心课程统计学统计学经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用第第1212章章 多元线性回归多元线性回归12.112.1 多元线性回归模型多元线性回归模型 12.212.2 回归方程的拟合优度回归方程的拟合优度12.3 12.3 显著性检验显著性检验12.4 12.
2、4 多重共线性多重共线性12.512.5 利用回归方程进行估计和预测利用回归方程进行估计和预测(删去删去)12.612.6 变量选择与逐步回归变量选择与逐步回归(删去删去)12.7 12.7 虚拟自变量的回归虚拟自变量的回归 经管类经管类 核心课程核心课程统计学统计学经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用12.112.1 多元线性回归模型多元线性回归模型12.1.1 12.1.1 多元回归模型与回归方程多元回归模型与回归方程12.1.2 12.1.2 估计的多元回归方程估计的多元回归方程12.1.3 1
3、2.1.3 参数的最小二乘估计参数的最小二乘估计 经管类经管类 核心课程核心课程统计学统计学经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用12.1 12.1 多元线性回归模型多元线性回归模型一一个个因因变变量量与与两两个个及及两两个个以以上上自自变变量量的的回回归归问问题题就就是是多元回归。多元回归。12.1.1 多元回归模型与回归方程多元回归模型与回归方程设设因因变变量量y,k个个自自变变量量分分别别为为x1,x2,xk,描描述述因因变变量量y如如何何依依赖赖自自变变量量x1,x2,xk和和误误差差项项 的的
4、 方方 程程,称称 为为 多多 元元 回回 归归 模模 型型(multiple regression model)。多元回归模型一般形式为:。多元回归模型一般形式为:其中,其中,0 ,1 1,k是参数是参数 是被称为误差项的随机变量是被称为误差项的随机变量y 是是x1,,x2 ,xk 的线性函数加上误差项的线性函数加上误差项 包包含含在在y里里面面但但不不能能被被k个个自自变变量量的的线线性性关关系系所所解解释的变异性释的变异性 经管类经管类 核心课程核心课程统计学统计学经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务
5、的费用12.1.1 12.1.1 多元回归模型与回归方程多元回归模型与回归方程(1).(1).误误差差项项是是一一个个期期望望值值为为0的的随随机机变变量量,即即E()=0。即:。即:(2).(2).对对于于自自变变量量x1,x2,xk的的所所有有值值,的的方方差差 2都相同都相同(3).(3).误误差差项项是是一一个个服服从从正正态态分分布布的的随随机机变变量量,即即N(0,2),且且相相互互独独立立。独独立立性性意意味味着着对对于于自自变变量量x1,x2,xk的的一一组组特特定定值值所所对对应应的的与与x1,x2,xk任任意意一一组组其其他他值值所所对对应应的的不不相相关关。正正态态性性意
6、意味味着着对对于于给给定定的的x1,x2,xk的的值值,因变量因变量y也是一个服从正态分布的随机变量。也是一个服从正态分布的随机变量。经管类经管类 核心课程核心课程统计学统计学经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用12.1.1 12.1.1 多元回归模型与回归方程多元回归模型与回归方程根根据据回回归归模模型型的的假假定定有有E(y)=0+1x1+2x2+k xk,上上式式称称为为多多元元回回归归方方程程(multiple regression equation),它它描描述述了了因因变变量量y的的期期望
7、望值值与与自自变变量量x1,x2,.,xk之间的关系。之间的关系。经管类经管类 核心课程核心课程统计学统计学经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用12.1.1 12.1.1 多元回归模型与回归方程多元回归模型与回归方程二元线性回归模型二元线性回归模型(观察到的y)回归面0 ix1yx2(x1,x2)经管类经管类 核心课程核心课程统计学统计学经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用12.1.2 12.1.2 估计的多
8、元回归方程估计的多元回归方程 经管类经管类 核心课程核心课程统计学统计学经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用12.1.3 12.1.3 参数的最小二乘估计参数的最小二乘估计2.2.求解求解各回归参数的标准方程如下各回归参数的标准方程如下1.1.使使因因变变量量的的观观察察值值与与估估计计值值之之间间的的离离差差平平方方和和达到最小来求得达到最小来求得 。即。即 经管类经管类 核心课程核心课程统计学统计学经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者
9、购买商品的价款或接受服务的费用12.1.3 12.1.3 参数的最小二乘估计参数的最小二乘估计【例例12.112.1】继继续续沿沿用用第第1111章章中中例例11.611.6。一一家家大大型型商商业业银银行行在在多多个个地地区区设设有有分分行行,其其业业务务主主要要是是进进行行基基础础设设施施建建设设、国国家家重重点点项项目目建建设设、固固定定资资产产投投资资等等项项目目的的贷贷款款。近近年年来来,该该银银行行的的贷贷款款额额平平稳稳增增长长,但但不不良良贷贷款款额额也也有有较较大大比比例例的的提提高高,这这给给银银行行业业务务的的发发展展带带来来较较大大压压力力。为为弄弄清清楚楚不不良良贷贷
10、款款形形成成的的原原因因,抽抽取取了了该该银银行行所所属属的的2525家家分分行行20022002年年的的有有关关业业务务数数据据。试试建建立立不不良良贷贷款款(y)与与贷贷款款余余额额(x1)、累累计计应应收收贷贷款款(x2)、贷贷款款项项目目个个数数(x3)和和固固定定资资产产投投资资额额(x4)的的线线性性回回归归方方程程,并并解解释释各各回回归系数的含义归系数的含义 用用Excel进行回归进行回归 经管类经管类 核心课程核心课程统计学统计学经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用12.1.3 12
11、.1.3 参数的最小二乘估计参数的最小二乘估计 经管类经管类 核心课程核心课程统计学统计学经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用12.212.2 回归方程的拟合优度回归方程的拟合优度12.2.1 12.2.1 多重判定系数多重判定系数12.2.2 12.2.2 估计标准误差估计标准误差 经管类经管类 核心课程核心课程统计学统计学经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用12.2 12.2 多重判定系数多重判定系数多元
12、回归中因变量离差平方和的分解:多元回归中因变量离差平方和的分解:SST=SSR+SSE多多 重重 判判 定定 系系 数数(multiple coefficient of determination)是是多多元元回回归归中中的的回回归归平平方方和和占占总总平平方方和和的的比比例例,它它是是度度量量多多元元回回归归方方程程拟拟合合程程度度的的一一个个统统计计量量,反反映映了了在在因因变变量量y的的变变差差中中被被估估计计的的回回归方程所解释的比例。归方程所解释的比例。计算公式为计算公式为 经管类经管类 核心课程核心课程统计学统计学经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受
13、到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用12.2 12.2 多重判定系数多重判定系数注注:由由于于自自变变量量个个数数的的增增加加,将将影影响响到到因因变变量量中中被被估估计计回回归归方方程程中中所所解解释释的的变变差差数数量量。当当增增加加自自变变量量时时,会会使使预预测测误误差差变变得得比比较较小小,从从而而减减少少残残差差平平方方和和SSE,由由于于回回归归平平方方和和SSR=SST-SSE,当当SSE变变小小时时,SSR会会变变大大,从从而而R2也也会会变变大大。如如果果模模型型中中增增加加一一个个自自变变量量,即即使使这这个个自自变变量量在在统统计计上上并并不不
14、显显著著,R2也也会会变变大大,为为避避免免这这种种情情况况,提提出出调调整整的的多多重重判判定定 系系 数数(adjusted multiple coefficient of determination)计算公式为计算公式为 经管类经管类 核心课程核心课程统计学统计学经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用12.2 12.2 多重判定系数多重判定系数调整的多重判定系数调整的多重判定系数 的解释与的解释与R2类似,不同的是:类似,不同的是:(1).(1).同同时时考考虑虑了了样样本本量量和和模模型型中中的
15、的自自变变量量的的个个数数的的影影响响,这这就就使使得得 的的值值永永远远小小于于R2,而而且且 的的值值不不会会由由于于模模型型中中自自变变量量个个数数的的增增加加而而越越来来越越接接近近1。因因此此,在在多多元元回回归归分分析析中中,通通常常用用调调整整的的多重判定系数。多重判定系数。(2).(2).R2的的平平方方根根称称为为多多重重相相关关系系数数,也也称称为为复复相相关关系数,它度量了因变量同系数,它度量了因变量同k个自变量的相关程度。个自变量的相关程度。经管类经管类 核心课程核心课程统计学统计学经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的
16、金额为消费者购买商品的价款或接受服务的费用12.2.2 12.2.2 估计标准误差估计标准误差多多元元回回归归分分析析中中的的估估计计标标准准误误差差也也是是对对误误差差项项 的的标标准准差差 的的一一个个估估计计值值,它它是是衡衡量量多多元元回回归归方方程程的的拟合优度方面也起着重要作用。拟合优度方面也起着重要作用。计算公式为计算公式为多元回归中对多元回归中对se的解释:的解释:由由于于se所所估估计计的的是是预预测测误误差差的的标标准准差差,其其含含义义是是根根据据自自变变量量x1,x2,xk来来预预测测因因变变量量y时时的的平平均均预预测误差。测误差。经管类经管类 核心课程核心课程统计学
17、统计学经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用12.312.3 显著性检验显著性检验12.3.1 12.3.1 线性关系检验线性关系检验12.3.2 12.3.2 回归系数检验和推断回归系数检验和推断 经管类经管类 核心课程核心课程统计学统计学经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用12.3.1 12.3.1 线性关系检验线性关系检验1.1.检检验验因因变变量量与与所所有有自自变变量量之之间间的的关关系系是是否否显显
18、著著,也被称为总体显著性检验。也被称为总体显著性检验。2.2.检检验验方方法法是是将将回回归归平平方方和和(SSR)同同残残差差平平方方和和(SSE)加加以以比比较较,应应用用F检检验验来来分分析析二二者者之之间间的差别是否显著。的差别是否显著。如如果果是是显显著著的的,因因变变量量与与自自变变量量之之间间存存在在线线性关系性关系 如如果果不不显显著著,因因变变量量与与自自变变量量之之间间不不存存在在线线性关系性关系 经管类经管类 核心课程核心课程统计学统计学经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用12.
19、3.1 12.3.1 线性关系检验线性关系检验第第1 1步:提出步:提出假设假设H0:1 2 k=0 线性关系不显著线性关系不显著H1:1,2,k至少有一个不等于至少有一个不等于0第第2 2步:计算检验统计量步:计算检验统计量F第第3 3步:作出统计决策。给定步:作出统计决策。给定显著性水平显著性水平 和分子和分子自由度自由度k、分母自由度、分母自由度n-k-1找出临界值找出临界值F,若,若FF,拒绝,拒绝H0;若若FF,所以拒绝,所以拒绝H0,这意味着不良贷款与贷款余,这意味着不良贷款与贷款余额、累计应收贷款、贷款项目个数和固定资产投资额、累计应收贷款、贷款项目个数和固定资产投资额之间的线性
20、关系是显著的。额之间的线性关系是显著的。经管类经管类 核心课程核心课程统计学统计学经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用12.3.2 12.3.2 回归系数检验和推断回归系数检验和推断1.1.在在回回归归方方程程通通过过线线性性关关系系检检验验后后,就就可可以以对对各各个个回回归归系系数数有有选选择择地地进进行行一一次次或或多多次次检检验验。但但究究竟竟要要对对哪哪几几个个回回归归系系数数进进行行检检验验,通通常常需需要要在在建建立立模模型型之之前前作作出出决决定定。对对回回归归系系数数检检验验的的个个
21、数数进进行行限限制制,以以避避免免犯犯过过多多的的第第一一类错误类错误(弃真错误弃真错误)2.2.对每一个自变量都要单独进行检验对每一个自变量都要单独进行检验3.3.应用应用 t 检验统计量检验统计量 经管类经管类 核心课程核心课程统计学统计学经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用12.3.2 12.3.2 回归系数检验和推断回归系数检验和推断4.4.回归系数回归系数检验的具体步骤:检验的具体步骤:提出假设提出假设H0:i=0 (自变量自变量 xi 与与 因变量因变量 y 没有线性关系没有线性关系)H1
22、:i 0 (自变量自变量 xi 与与 因变量因变量 y有线性关系有线性关系)计算检验的统计量计算检验的统计量 t作出统计决策作出统计决策。给定显著性水平。给定显著性水平,并进行决策,并进行决策 t t,拒绝,拒绝H0;t t(25-2)=2.07,所所以以均均拒拒绝绝原原假假设设,说说明明这这4个个自自变变量量两两两两之之间间都都有有显著的相关关系显著的相关关系 经管类经管类 核心课程核心课程统计学统计学经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用12.4.2 12.4.2 多重共线性的判别多重共线性的判别2
23、.2.由由表表Excel输输出出的的结结果果可可知知,回回归归模模型型的的线线性性关关系系显显著著(Significance-F1.03539E-06=0.05)。这这也也暗暗示示了模型中存在多重共线性了模型中存在多重共线性3.3.固固定定资资产产投投资资额额的的回回归归系系数数为为负负号号(-0.029),与与预预期的不一致期的不一致由以上三点可以判断回归模型中存在多重共线性。由以上三点可以判断回归模型中存在多重共线性。经管类经管类 核心课程核心课程统计学统计学经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用1
24、2.4.3 12.4.3 多重共线性问题的处理多重共线性问题的处理多重共线性问题的解决办法:多重共线性问题的解决办法:(1).(1).将将一一个个或或多多个个相相关关的的自自变变量量从从模模型型中中剔剔除除,使使保留的自变量尽可能不相关保留的自变量尽可能不相关(2).(2).如如果果要要在在模模型型中中保保留留所所有有的的自自变变量量,则则应应该该:避避免免根根据据t统统计计量量对对单单个个参参数数进进行行检检验验;对对因因变变量量y值值的的推推断断(估估计计或或预预测测)限限定定在在自自变变量量样样本本值值的范围内。的范围内。经管类经管类 核心课程核心课程统计学统计学经营者提供商品或者服务有
25、欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用12.4.3 12.4.3 多重共线性问题的处理多重共线性问题的处理【例例12.512.5】利利用用例例12.112.1所所建建立立的的回回归归方方程程,对对多多重重共线性问题进行处理。共线性问题进行处理。解解:首首先先,考考虑虑将将一一些些相相关关的的自自变变量量从从模模型型中中剔剔除除。从从前前表表可可以以看看出出,贷贷款款余余额额与与贷贷款款项项目目个个数数的的相相关关系系数数最最高高,而而且且从从定定性性角角度度看看,贷贷款款余余额额与与应应收收贷贷款款之之间间也也有有很很强强的的
26、相相关关关关系系。因因此此将将贷贷款款项项目目个个数数和和累累积积应应收收贷贷款款这这两两个个自自变变量量剔剔除除,建建立立不不良良贷贷款款与与贷贷款款余余额额和和固固定定资资产产投投资资额额的的线线性性模模型型。从从结结果果可可以以看看出出,线线性性关关系系和和各各回回归归系系数数在在0.050.05的的显显著著水水平平下下是是显显著著的的,多多重共线性问题不存在了。重共线性问题不存在了。经管类经管类 核心课程核心课程统计学统计学经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用12.4.3 12.4.3 多重共
27、线性问题的处理多重共线性问题的处理多多重重共共线线性性问问题题带带来来的的主主要要麻麻烦烦是是对对单单个个回回归归系系数数的的解解释释和和检检验验。在在求求因因变变量量的的置置信信区区间间和和预预测测区区间间时时一一般般不不会会受受其其影影响响,但但必必须须保保证证用用于于估估计计或或预预测测的的自自变变量量的的值值是是在在样样本本数数据据的的范范围围之之内内。因因此此,如如果果仅仅仅仅是是为为了了估估计计或或预预测测,可可以以将所有自变量都保留在模型中。将所有自变量都保留在模型中。在在建建立立多多元元线线性性回回归归模模型型时时,不不要要试试图图引引入入更更多多的的自自变变量量,除除非非有有
28、必必要要。特特别别是是在在社社会会科科学学的的研研究究中中,由由于于所所使使用用的的大大多多数数数数据据都都是是非非试试验验性性质质的的,因因此此,在在某某些些情情况况下下,得得到到的的结结果果往往往往并并不不令令人人满满意意,但但这这不不一一定定是是选选择择的的模模型型不不适适合合,而而是是数数据据的的质质量量不不好好,或或者者是是由由于于引引入入的的自变量不合适。自变量不合适。经管类经管类 核心课程核心课程统计学统计学经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用12.712.7 虚拟自变量的回归虚拟自变量
29、的回归12.7.1 12.7.1 在模型中引进虚拟变量在模型中引进虚拟变量12.7.2 12.7.2 含有一个虚拟自变量的回归含有一个虚拟自变量的回归 经管类经管类 核心课程核心课程统计学统计学经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用12.7.1 12.7.1 在模型中引进虚拟变量在模型中引进虚拟变量1.1.虚虚拟拟变变量量(dummy(dummy variable)variable)是是指指用用数数字字代代码码表表示示的定性自变量的定性自变量2.2.当当模模型型中中使使用用虚虚拟拟自自变变量量时时,称称
30、为为虚虚拟拟自自变变量量的的回归。回归。3.3.虚拟变量的取值只能是虚拟变量的取值只能是0 0,1 14.4.回归分析中引入虚拟自变量的方法:回归分析中引入虚拟自变量的方法:(1).(1).如果定性自变量只有两个水平时。如果定性自变量只有两个水平时。比如,性别比如,性别(男,女男,女)经管类经管类 核心课程核心课程统计学统计学经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用12.7.1 12.7.1 在模型中引进虚拟变量在模型中引进虚拟变量(2).(2).有两个以上水平的虚拟自变量。有两个以上水平的虚拟自变量。比
31、如,贷款企业的类型比如,贷款企业的类型(家电,医药,其他家电,医药,其他)一一般般而而言言,如如果果定定性性自自变变量量有有k个个水水平平,需需要要引引入入k-1个虚拟变量。个虚拟变量。5.5.对对于于含含有有一一个个虚虚拟拟自自变变量量的的回回归归,采采用用下下列列形形式式的的回归方程:回归方程:经管类经管类 核心课程核心课程统计学统计学经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用12.7.1 12.7.1 在模型中引进虚拟变量在模型中引进虚拟变量【例例12.812.8】为为研研究究考考试试成成绩绩与与性性
32、别别之之间间的的关关系系,从从某某大大学学商商学学院院随随机机抽抽取取男男女女学学生生各各8 8名名,得得到到他他们们的的市市场场营营销销学学课课程程的的考考试成绩如下表试成绩如下表 对性别引入虚拟变量对性别引入虚拟变量 经管类经管类 核心课程核心课程统计学统计学经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用12.7.212.7.2含有一个虚拟自变量的回归含有一个虚拟自变量的回归1.1.模型模型中只含有一个虚拟变量的回归:中只含有一个虚拟变量的回归:建立回归模型为:建立回归模型为:y=0+1x+回归方程可写:回
33、归方程可写:E(y)=0+1x 男男(x=0):E(y)=0男学生考试成绩的期望值男学生考试成绩的期望值 女女(x=1):E(y)=0+1女学生考试成绩的期望值女学生考试成绩的期望值注意:当指定虚拟变量注意:当指定虚拟变量01时时 0总总是是代代表表与与虚虚拟拟变变量量值值0所所对对应应的的那那个个分分类类变变量量水水平的平均值平的平均值 1总总是是代代表表与与虚虚拟拟变变量量值值1所所对对应应的的那那个个分分类类变变量量水水平平的的平平均均响响应应与与虚虚拟拟变变量量值值0所所对对应应的的那那个个分分类类变变量水平的平均值的差值,即量水平的平均值的差值,即 平均值的差值平均值的差值=(0+1
34、)-0=1 经管类经管类 核心课程核心课程统计学统计学经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用12.7.212.7.2含有一个虚拟自变量的回归含有一个虚拟自变量的回归解:散点图解:散点图男 女【例例12.912.9】沿沿用用例例12.812.8。试试建建立立考考试试成成绩绩与与性性别别之之间间的线性回归模型,并解释回归系数的含义。的线性回归模型,并解释回归系数的含义。经管类经管类 核心课程核心课程统计学统计学经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费
35、者购买商品的价款或接受服务的费用12.7.212.7.2含有一个虚拟自变量的回归含有一个虚拟自变量的回归【例例12.1012.10】为为研研究究工工资资水水平平与与工工作作年年限限和和性性别别之之间间的的关关系系,在在某某行行业业中中随随机机抽抽取取1010名名职职工工,所所得得数数据据如如下表下表 经管类经管类 核心课程核心课程统计学统计学经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用12.7.212.7.2含有一个虚拟自变量的回归含有一个虚拟自变量的回归2.2.模型模型中含有一个数值型自变量和一个虚拟变量回
36、归中含有一个数值型自变量和一个虚拟变量回归引进虚拟变量时,回归方程可写:引进虚拟变量时,回归方程可写:E(y)=0+1x1+2x2女女(x2=0):E(y|女性女性)=0+1x1男男(x2=1):E(y|男性男性)=(0+2)+1x1 0的含义表示:女性职工的期望月工资收入的含义表示:女性职工的期望月工资收入(0+2)的含义表示:男性职工的期望月工资收入的含义表示:男性职工的期望月工资收入 1含含义义表表示示:工工作作年年限限每每增增加加1年年,男男性性或或女女性性工工资资的的平均增加值平均增加值 2含含义义表表示示:男男性性职职工工的的期期望望月月工工资资收收入入与与女女性性职职工工的的期望
37、月工资收入之间的差值期望月工资收入之间的差值(0+2)-0=2 经管类经管类 核心课程核心课程统计学统计学经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用习题选讲【习题习题12.0112.01】根据下面的数据用】根据下面的数据用ExcelExcel进行回归,并对进行回归,并对回归结果进行讨论,计算回归结果进行讨论,计算x1 1=200=200、x2 2=7=7时时y的预测值。的预测值。SUMMARY OUTPUTSUMMARY OUTPUT回归统计回归统计Multiple RMultiple R0.4592340
38、.459234R SquareR Square0.2108960.210896Adjusted R SquareAdjusted R Square-0.01456-0.01456标准误差标准误差13.3412213.34122观测值观测值1010 经管类经管类 核心课程核心课程统计学统计学经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用习题选讲 方差分析dfSSMSFSignificance F回归分析2332.9837166.49190.935410.436485残差71245.916177.988总计9157
39、8.9 Coefficients标准误差t StatP-valueIntercept25.028722.278631.123440.298298X Variable 1-0.049710.105992-0.469040.653301X Variable 21.9281691.472161.3097550.231624 经管类经管类 核心课程核心课程统计学统计学经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用习题选讲【习题【习题12.0212.02】根据下面】根据下面ExcelExcel输出的回归结果,说明模输出的
40、回归结果,说明模型中涉及多少个自变量?多少个观察值?写出回归方程,型中涉及多少个自变量?多少个观察值?写出回归方程,并根据并根据F、se、R2 2及修正的的值对模型进行讨论。及修正的的值对模型进行讨论。经管类经管类 核心课程核心课程统计学统计学经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用习题选讲【习题【习题12.0312.03】根据两个自变量得到的多元回归方程为根据两个自变量得到的多元回归方程为 经管类经管类 核心课程核心课程统计学统计学经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的
41、损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用习题选讲【习题【习题12.0412.04】一家电器销售公司的管理人员认为,每一家电器销售公司的管理人员认为,每月的销售额是广告费用的函数,并想通过广告费用对月的销售额是广告费用的函数,并想通过广告费用对月销售额作出估计。下面是近月销售额作出估计。下面是近8 8个月的销售额与广告个月的销售额与广告费用数据。要求:费用数据。要求:(1).(1).用电视广告费用作自变量,月用电视广告费用作自变量,月销售额作因变量,建立估计的回归方程。销售额作因变量,建立估计的回归方程。(2).(2).用电视用电视广告费用和报纸广告费用作自变量,月销售额作因变
42、广告费用和报纸广告费用作自变量,月销售额作因变量,建立估计的回归方程。量,建立估计的回归方程。(3).(3).上述上述(1)(1)和和(2)(2)所建立所建立的估计方程,电视广告费用的系数是否相同?对其回的估计方程,电视广告费用的系数是否相同?对其回归系数分别进行解释。归系数分别进行解释。(4).(4).根据问题根据问题(2)(2)所建立的估所建立的估计方程,在销售收入的总变差中,被估计的回归方程计方程,在销售收入的总变差中,被估计的回归方程所解释的比例是多少?所解释的比例是多少?(5).(5).根据问题根据问题(2)(2)所建立的估所建立的估计方程,检验回归系数是否显著计方程,检验回归系数是
43、否显著(=0.05)=0.05)?经管类经管类 核心课程核心课程统计学统计学经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用习题选讲 经管类经管类 核心课程核心课程统计学统计学经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用习题选讲【习题【习题12.0512.05】某农场通过试验取得早稻收获量与春季某农场通过试验取得早稻收获量与春季降雨量和春季温度的数据如下。降雨量和春季温度的数据如下。要求:要求:(1).(1).试确定早稻收获量对
44、春季降雨量和春季温度试确定早稻收获量对春季降雨量和春季温度的二元线性回归方程。的二元线性回归方程。(2).(2).解释回归系数的实际意义。解释回归系数的实际意义。(3).(3).根据你的判断,模型中是否存在多重共线性?根据你的判断,模型中是否存在多重共线性?经管类经管类 核心课程核心课程统计学统计学经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用习题选讲【习题习题12.1212.12】为分析某行业中的薪水有无性别歧视,】为分析某行业中的薪水有无性别歧视,从该行业中随机抽取从该行业中随机抽取1515名员工,有关的数
45、据如下。要名员工,有关的数据如下。要求:用求:用ExcelExcel进行回归,并对结果进行分析。进行回归,并对结果进行分析。经管类经管类 核心课程核心课程统计学统计学经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用习题选讲【习题【习题12.0612.06】一家房地产评估公司想对某城市的房地一家房地产评估公司想对某城市的房地产销售价格产销售价格y与地产的评估价值与地产的评估价值x1、房产的评估价值、房产的评估价值x2和使用面积和使用面积x3建立一个模型,以便对销售价格作出合建立一个模型,以便对销售价格作出合理预测。
46、为此,收集了理预测。为此,收集了20栋住宅的房地产评估数据如栋住宅的房地产评估数据如下。用下。用Excel进行回归,回答下面的问题:进行回归,回答下面的问题:(1).(1).写出估计的多元回归方程。写出估计的多元回归方程。(2).(2).在销售价格的总变差中,被估计的回归方程所解释在销售价格的总变差中,被估计的回归方程所解释的比例是多少?的比例是多少?(3).(3).检验回归方程检验回归方程的线性关系是否显著的线性关系是否显著(=0.05)=0.05)。(4).(4).检验检验各回归系数是否显著各回归系数是否显著(=0.05)=0.05)?经管类经管类 核心课程核心课程统计学统计学经营者提供商
47、品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用习题选讲【习题【习题12.0712.07】根据】根据11.411.4题中的数据,回答下面的问题:题中的数据,回答下面的问题:(1).(1).=0.01=0.01的水平下,检验二元回归模型线性关系的的水平下,检验二元回归模型线性关系的显著性。显著性。(2).(2).在在=0.05=0.05的水平下,检验回归系数的水平下,检验回归系数b b1 1的显著性,的显著性,你认为你认为x1 1应该从模型中剔除吗?应该从模型中剔除吗?(3).(3).在在=0.05=0.05的水平下,检验回归
48、系数的水平下,检验回归系数b b2 2的显著性,的显著性,你认为你认为x2 2应该从模型中剔除吗应该从模型中剔除吗?经管类经管类 核心课程核心课程统计学统计学经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用习题选讲【习题【习题12.0812.08】根据下面的数据回答下面的问题:根据下面的数据回答下面的问题:(1).(1).计算计算y与与x1 1之间的相关系数,有无证据表明二者之之间的相关系数,有无证据表明二者之间存在线性关系间存在线性关系(=0.05)=0.05)?(2).(2).计算计算y与与x2 2之间的相关
49、系数,有无证据表明二者之之间的相关系数,有无证据表明二者之间存在线性关系间存在线性关系(=0.05)=0.05)?(3).(3).根据上面的结论,你认为根据上面的结论,你认为E(y)=)=b b0 0+b b1 1x1 1+b+b2 2x2 2对预测对预测y是否有用?是否有用?(4).(4).用用ExcelExcel进行回归,并对模型进行检验,所得的结进行回归,并对模型进行检验,所得的结论与论与(3)(3)是否相同?是否相同?(5)(5)计算计算x1 1与与x2 2之间的相关系数,所得结果意味着什么之间的相关系数,所得结果意味着什么?经管类经管类 核心课程核心课程统计学统计学经营者提供商品或者
50、服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用习题选讲【习题习题12.0912.09】下面是随机抽取的】下面是随机抽取的1515家大型商场销售的同家大型商场销售的同类产品的有关数据类产品的有关数据(单位:元单位:元)。要求:要求:(1).(1).计算计算y与与x1 1、y与与x2 2之间的相关系数,是否有证之间的相关系数,是否有证据表明销售价格与购进价格、销售价格与销售费用之据表明销售价格与购进价格、销售价格与销售费用之间存在线性关系?间存在线性关系?(2).(2).根据上述结果,你认为用购进价格和销售费用来预根据上述结果,你认