《应用统计学第8章--相关分析与回归分析课件.ppt》由会员分享,可在线阅读,更多相关《应用统计学第8章--相关分析与回归分析课件.ppt(77页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第八章相关分析第八章相关分析 与回归分析与回归分析 1裙边理论n裙边理论是美国宾夕法尼亚大学经济学家乔治裙边理论是美国宾夕法尼亚大学经济学家乔治泰勒于泰勒于1920年提出的一种形象描述市场走势年提出的一种形象描述市场走势的理论。的理论。n当妇女普遍选择短裙,裙边向上收时,股市也当妇女普遍选择短裙,裙边向上收时,股市也随之上扬,如随之上扬,如20世纪的世纪的20年代和年代和60年代;相反,年代;相反,当妇女穿着长裙,裙边向下降时,市场也逐渐当妇女穿着长裙,裙边向下降时,市场也逐渐走低,如走低,如20世纪的世纪的30年代和年代和40年代。年代。2子女平均身高n英国统计学家高尔顿英国统计学家高尔顿(
2、Francis Galton,18221911)和他的学生皮尔逊和他的学生皮尔逊(Karl Pearson,18561936)n 研究表明:父亲平均身高每增减研究表明:父亲平均身高每增减1个单位时,个单位时,其成年儿子的身高仅平均增减其成年儿子的身高仅平均增减0.516个单位。个单位。这种遗传身高趋于一般的现象,高尔顿首次提这种遗传身高趋于一般的现象,高尔顿首次提出出“回归回归”一词加以概括。一词加以概括。3本章学习目标1.1.掌握掌握相关关系相关关系的概念与计算。的概念与计算。2.2.理解理解回归分析回归分析的特点,熟练掌握的特点,熟练掌握一元线性回归一元线性回归方程方程的建立的建立及检验及
3、检验方法。方法。46相关关系的种类的关系图相关关系的种类的关系图涉及的变量或涉及的变量或因素的个数因素的个数两变量间的关系7图图1变量间的线性关系变量间的线性关系 图图2 变量间的非线性关系变量间的非线性关系两变量间的关系8 图图3正向线性关系正向线性关系 图图4 负向线性关系负向线性关系 图图5 无关系无关系广告支出与销售收入10单位:万元相关表相关表是将具有相关关系的原始数据是将具有相关关系的原始数据,按某一顺序按某一顺序平行排列在一张表上平行排列在一张表上,以观察它们之间的相互关系。以观察它们之间的相互关系。分公司名称 广告支出X 年销售额Y 大通 300 9,500 大德 400 10
4、,300 大信 500 11,000 大道 500 12,000 大方 800 12,400 大立 1,000 13,400 大兴 1,000 14,500 大展 1,300 15,300 广告支出与销售收入的散点图11相关图相关图也称为分布图或散点图也称为分布图或散点图相关系数相关系数n相关系数是指在相关系数是指在直线相关直线相关条件下,说明两条件下,说明两个现象之间相关关系个现象之间相关关系密切程度密切程度的统计分析的统计分析指标。指标。n总体相关系数总体相关系数13广告支出与销售收入大发汽車大发汽車的汽车销售额与广告支出间有的汽车销售额与广告支出间有很高的线性关系很高的线性关系15合计相
5、关系数16若若 ,表示变量,表示变量x x与变量与变量y y为为线性正相关线性正相关关系;若关系;若 ,表示变量,表示变量x x与变量与变量y y为为线性负相关线性负相关关系。关系。若若 ,表示两变量,表示两变量完全线性相关完全线性相关,即变量,即变量x x与变量与变量y y之之间存在确定的函数关系。间存在确定的函数关系。相关系数18 微弱相关;微弱相关;低度相关;低度相关;显著相关;显著相关;高度相关高度相关通常认为:通常认为:相关系数19若若 ,表示两变量不存在线性相关。,表示两变量不存在线性相关。相关系数的显著性检验n检定两变量有无线性关关系检定两变量有无线性关关系n利用利用 t 檢定檢
6、定20如果如果 ,就否定原假设,认为,就否定原假设,认为 r r 在统计上是显在统计上是显著的,即总体相关系数不为零,总体变量间存在线性相著的,即总体相关系数不为零,总体变量间存在线性相关关系。关关系。广告支出与销售收入n检定广告支出与销售额间的相关系数是否为检定广告支出与销售额间的相关系数是否为0:nt 检定統計量检定統計量n设显著性水平设显著性水平 ,臨界值臨界值 拒絕拒絕 ,亦即亦即广告支出与销售额广告支出与销售额有关系有关系21广告支出与销售收入22单位:万元 分公司名称 广告支出X 年销售额Y 大通 300 9,500 大德 400 10,300 大信 500 11,000 大道 5
7、00 12,000 大方 800 12,400 大立 1,000 13,400 大兴 1,000 14,500 大展 1,300 15,300 n假设大发汽车公司营业部的经理相信汽车销售假设大发汽车公司营业部的经理相信汽车销售额的多寡与广告支出数额有关。但此两者间的额的多寡与广告支出数额有关。但此两者间的具体关系为何并不清楚。具体关系为何并不清楚。简单线性回归分析简单线性回归分析24广告支出与销售额25 广告支出广告支出与销售收入的散布图与销售收入的散布图 广告支出广告支出与销售收入的关系与销售收入的关系汽车汽车销售收入的多寡会受到广销售收入的多寡会受到广告支出影响告支出影响回归分析方法的步骤
8、1.建立简单线性回归模型建立简单线性回归模型26随机误差项随机误差项回归分析方法的步骤1.建立简单线性回归模型建立简单线性回归模型2.利用搜集的数据来估计回归模型利用搜集的数据来估计回归模型28估计回归模型n整理得整理得n估计式估计式30广告支出与销售收入31合计广告支出与销售收入32回归分析方法的步骤1.建立简单线性回归模型建立简单线性回归模型2.利用搜集的数据来估计回归模型利用搜集的数据来估计回归模型3.评判回归模型评判回归模型33评判回归模型n拟合优度检验拟合优度检验n模型的显著性检验模型的显著性检验n变量的显著性检验变量的显著性检验34模型的拟合优度检验 n拟合优度检验拟合优度检验:对
9、样本回归直线与样本观测值:对样本回归直线与样本观测值之间拟合程度的检验。之间拟合程度的检验。n度量拟合优度的指标:度量拟合优度的指标:判定系数(可决系数)判定系数(可决系数)R23536 如果如果 即实际观测值落在样本回归即实际观测值落在样本回归“线线”上,则上,则拟合最好拟合最好。可认为可认为,“离差离差”全部来自回归线,而与全部来自回归线,而与“残差残差”无关。无关。:可认为是由回归直线解释的部分:是回归直线不能解释的部分判定系数n誤差誤差37SST,总体平方和SSR,回归平方和SSE,残差平方和38TSS=SSR+SSE Y的观测值围绕其均值的总离差总离差(total variation
10、)可分解为两部分:一部分来自回归一部分来自回归线线(SSR),另一部分则来自随机势力,另一部分则来自随机势力(SSE)。在给定样本中,在给定样本中,SST不变,不变,如果实际观测点离样本回归线越近,则如果实际观测点离样本回归线越近,则SSR在在SST中占的比重越大,因此中占的比重越大,因此 拟合优度拟合优度:回归平方和:回归平方和SSR/YSSR/Y的总离差的总离差SSTSST模型的拟合优度 判定系数n誤差誤差n判定系数判定系数39SST,总体平方和SSR,回归平方和SSE,残差平方和判定系数40样本回归方程式完全无拟合度广告支出与销售收入41SSTSSE模型已解释总离差的93%评判回归模型n
11、拟合优度检验拟合优度检验n模型的显著性检验模型的显著性检验n变量的显著性检验变量的显著性检验42线性关系是否显著n检验此回归方程有无解释能力检验此回归方程有无解释能力nF检定检定q F检定统计量检定统计量q 决策法則决策法則n 時,則拒絕 n 時,則不拒絕43无解释能力有解释能力广告支出与销售收入n檢定統計量檢定統計量n显著性水平显著性水平 =0.05 0.05 下,檢定量大於臨界值下,檢定量大於臨界值 ,因此拒絕因此拒絕44评判回归模型n拟合优度检验拟合优度检验n模型的显著性检验模型的显著性检验n变量的显著性检验变量的显著性检验45解释变量的显著性检验n对对 的检定的检定nt 检定检定q t
12、 检定统计量检定统计量q 决策法則决策法則n 時,則拒絕 n 時,則不拒絕46(X对Y无直线性影响)(X对Y有直线性影响)广告支出与销售收入n请检验广告支出对销售额是否有正的影响请检验广告支出对销售额是否有正的影响?n两个假设两个假设n計算計算n显著性水平显著性水平 =0.05 下,檢定量大於臨界值下,檢定量大於臨界值 ,因此拒絕因此拒絕4748注意注意:n在一元线性回归分析中,回归系数的显著性在一元线性回归分析中,回归系数的显著性检验与回归模型的显著性检验是等价的,因检验与回归模型的显著性检验是等价的,因此此 t t 检验和检验和F F 检验的结论是一致检验的结论是一致的。的。以貌取人?n现
13、从某公司人事资料现从某公司人事资料中抽取中抽取33位员工的身高与薪位员工的身高与薪资资:n得出回归模型得出回归模型:身高身高(X),薪资薪资(Y)判定係數判定係數 ,49以貌取人?n评判回归模型、解释回归模型评判回归模型、解释回归模型q判定系数判定系数 很低,故很低,故拟合优度拟合优度不佳不佳q检定统计量检定统计量 ,不具解释不具解释能力能力。q ,该模型无解释能力,该模型无解释能力n下结论下结论这个企业没有这个企业没有“以貌取人以貌取人”的现象。的现象。50回归分析方法的步骤1.建立简单线性回归模型建立简单线性回归模型2.利用搜集的数据来估计回归模型利用搜集的数据来估计回归模型3.评判回归模
14、型评判回归模型4.解释回归模型解释回归模型51广告支出与销售收入52 的解释n回归方程回归方程n没有广告支出时,大发公司的预期销售额为没有广告支出时,大发公司的预期销售额为8,790.75万元。万元。53 的解释n每变动每变动1万元的广告支出,销售额会变动万元的广告支出,销售额会变动5.53万元。万元。54回归分析方法的步骤1.建立简单线性回归模型建立简单线性回归模型2.利用搜集的数据来估计回归模型利用搜集的数据来估计回归模型3.评判回归模型评判回归模型4.解释回归模型解释回归模型5.做预测做预测55预测ny y的的期望值期望值的置信区间估计的置信区间估计ny y的的个别值个别值的预测区间估计
15、的预测区间估计56从广告支出来预测销售额n回归方程回归方程n若广告支出为若广告支出为1,400万元时,汽车的平均销售万元时,汽车的平均销售额为额为多少多少?n汽車的平均銷售額汽車的平均銷售額57可靠度?从广告支出来预测销售额n回归方程回归方程n若广告支出为若广告支出为1,400万元时,汽车的平均销售万元时,汽车的平均销售额为额为多少,多少,其其95%的置信区间为何的置信区间为何?58給定給定 ,在在1-1-的置信水平下的置信的置信水平下的置信区间可表示为区间可表示为从广告支出来预测销售额59预测ny y的期望值的置信区间估计的期望值的置信区间估计ny y的的个别值个别值的预测区间估计的预测区间
16、估计60从广告支出来预测销售额n回归方程回归方程n若若明年明年广告支出为广告支出为1,400万元时,万元时,明年明年汽车的汽车的销售额为销售额为多少多少?61从广告支出来预测销售额n回归方程回归方程n若若明年明年广告支出为广告支出为1,400万元时,万元时,明年明年汽车的汽车的销售额为销售额为多少多少?62給定給定 ,在在1-1-的置信水平下的置信区间的置信水平下的置信区间从广告支出来预测销售额n回归方程回归方程n若若明年明年广告支出为广告支出为1,400万元时,万元时,明年明年汽车的汽车的销售额销售额的的95%的置信区间为何的置信区间为何?63从广告支出来预测销售额64回归分析方法的步骤1.
17、建立简单线性回归模型建立简单线性回归模型2.利用搜集的数据来估计回归模型利用搜集的数据来估计回归模型3.评判回归模型评判回归模型4.解释回归模型解释回归模型5.做预测做预测65多元线性回归分析多元线性回归分析66教育年数、工作年数与个人年所得67样本 教育年数 工作年数 年所得16738295403121453416850518655总计6140236平均数12.2847.2依据经济理论:个人一年的所得受教育程度及工作经验的影响X1X2Y回归分析方法的步骤1.建立多元线性回归模型建立多元线性回归模型68随机误差项随机误差项回归分析方法的步骤1.建立多元线性回归模型建立多元线性回归模型2.利用搜
18、集的数据来估计回归模型利用搜集的数据来估计回归模型69估计回归模型n观察值与估计值之差的平方和观察值与估计值之差的平方和使使 最小,解得估计式最小,解得估计式;70最小二乘估计最小二乘估计(OLS)(OLS)回归分析方法的步骤1.建立简单线性回归模型建立简单线性回归模型2.利用搜集的数据来估计回归模型利用搜集的数据来估计回归模型3.评判回归模型评判回归模型71教育年数、工作年数与个人年所得n评判回归模型评判回归模型q判定系数判定系数 ,調整後,調整後 ,故,故拟合优拟合优度度颇高颇高q检定统计量检定统计量 ,具解释具解释能力能力。q ,教育年数对所,教育年数对所得有显著影响力得有显著影响力q
19、,工作,工作年数对所得年数对所得有显著影响力有显著影响力q教育年数对所得的影响比工作年数显著教育年数对所得的影响比工作年数显著7273注意注意:n在多元回归分析中,在多元回归分析中,t t 检验只检验方程中各检验只检验方程中各个系数的显著性,而个系数的显著性,而 F F 检验则检验的是整检验则检验的是整个方程的显著性。个方程的显著性。回归分析方法的步骤1.建立简单线性回归模型建立简单线性回归模型2.利用搜集的数据来估计回归模型利用搜集的数据来估计回归模型3.评判回归模型评判回归模型4.解释回归模型解释回归模型74估计回归模型n观察值与估计值之差的平方和观察值与估计值之差的平方和使使 最小,解得
20、估计式最小,解得估计式;75最小二乘估计最小二乘估计(OLS)(OLS)当工作年数固定时,教育年数增加1年,所得增加1.36万元当教育年数固定时,工作年数增加1年,所得增加0.92万元回归分析方法的步骤1.建立简单线性回归模型建立简单线性回归模型2.利用搜集的数据来估计回归模型利用搜集的数据来估计回归模型3.评判回归模型评判回归模型4.解释回归模型解释回归模型5.做预测做预测76总结1.相关关系的测定方法、相关系数的计算方法。相关关系的测定方法、相关系数的计算方法。2.一一元元线线性性回回归归分分析析方方法法,重重点点掌掌握握回回归归系系数数的确定方法。的确定方法。3.多多元线性回归分析方法元线性回归分析方法77