《相关和回归分析程统计学共九章加一练习题总共十个.pptx》由会员分享,可在线阅读,更多相关《相关和回归分析程统计学共九章加一练习题总共十个.pptx(132页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、1本章学习要求1.理解相关的意义、主要形式、以及相关分析的基本内容。2.掌握相关系数的设计原理,以及相关关系显著性检验。3.回归和相关的区别和联系4.普通最小二乘法的原理以及回归参数的意义。5.估计标准误差的分析等。第1页/共132页2 第一节 相关的意义和种类一、问题的提出二、相关关系的概念三、相关关系的种类四、相关分析的主要内容第2页/共132页3一、问题的提出相关第3页/共132页4 相关和回归分析是研究事物的相互关系,测定它们联系的紧密程度,揭示其变化的具体形式和规律性的统计方法,是构造各种经济模型、进行结构分析、政策评价、预测和控制的重要工具。第4页/共132页5第5页/共132页6
2、第6页/共132页7一、相关关系的概念 客观现象之间的数量联系存在着两种不同的类型:函数关系和相关关系函数关系:即当一个(或一组)变量每取一个值时,相应的另一个变量必然有一个确定值与之对应。第7页/共132页8(函数关系)(1)是一一对应的确定关系(2)设有两个变量 x 和 y,变量 y 随变量 x 一起变化,并完全依赖于 x,当变量 x 取某个数值时,y 依确定的关系取相应的值,则称 y 是 x 的函数,记为 y=f(x),其中 x 称为自变量,y 称为因变量(3)各观测点落在一条线上 x xy y第8页/共132页9自变量与因变量如果变量之间有因果关系,那么原因变量就叫作自变量,而受自变量
3、影响的变量就称因变量。自变量通常发生在因变量之前。(不是所有先发生的变量都是自变量)一般自变量记为X,因变量 记为Y。第9页/共132页10【例】(1 1)某某种种商商品品的的销销售售额额(y y)与与销销售售量量(x x)之之间间的的关系可表示为关系可表示为 y y=p x p x(p p 为单价为单价)(2 2)圆的面积)圆的面积(S)(S)与半径之间的关系可表示为与半径之间的关系可表示为 S S=R R2 2(3 3)企企业业的的原原材材料料消消耗耗额额(y y)与与产产量量(x x1 1)、单单位位产产量量消消耗耗(x x2 2)、原原材材料料价价格格(x x3 3)之之间间的的关关系
4、系可可表示为表示为y y=x x1 1 x x2 2 x x3 3 第10页/共132页11 停下来 想一想?n在下面的几对变量中,哪一个是自变量哪一个是因变量?1.产品产量与总成本。2.销售税的总量与商品总成本。3.电影院里爆米花的销售率与垃圾袋的使用率。4.发电量与热天的天数。第11页/共132页12相关关系(correlation analysiscorrelation analysis):相关关系:变量之间存在有依存关系,但这种关系是不完全确定的随机关系,即当一个(或一组)变量每取一个值时,相应的另一个变量可能有多个不同值与之对应。第12页/共132页13因果关系相关关系互为因果关系共
5、变关系随机性依存关系确定性依存关系函数关系变量之间关系第13页/共132页14相关关系(1)变量间关系不能用函数关系精确表达;(2)一个变量的取值不能由另一个变量唯一确定;(3)当变量 x 取某个值时,变量 y 的取值可能有几个;(4)各观测点分布在直线周围。x xy y第14页/共132页15【例】商品的消费量(y)(y)与居民收入(x)(x)之间的关系商品销售额(y)(y)与广告费支出(x)(x)之间的关系粮食亩产量(y)(y)与施肥量(x(x1 1)、降雨量(x(x2 2)、温度(x(x3 3)之间的关系收入水平(y)(y)与受教育程度(x)(x)之间的关系父母亲身高(y)(y)与子女身
6、高(x)(x)之间的关系身高与体重的关系第15页/共132页16 停下来 想一想?下列变量之间存在相关关系吗?1 抽烟与肺癌之间的关系 2 怀孕期妇女的饮酒量与婴儿出生体重之间的关系 3 纳税者年龄和他们交纳税款的数量之间的关系 4 采光量与植物的生产量之间的关系 5 一个人的投票倾向性与其年龄之间的关系第16页/共132页17相关关系与函数关系的关系相关关系与函数关系的关系:在一定的条件下互相转在一定的条件下互相转化化.具有函数关系的变量具有函数关系的变量,当存在观测误差和随机当存在观测误差和随机因素影响时因素影响时,其函数关系往往以相关的形式表现出来其函数关系往往以相关的形式表现出来.而具
7、有相关关系的变量之间的联系而具有相关关系的变量之间的联系,如果我们对它如果我们对它们有了深刻的规律性认识们有了深刻的规律性认识,并且能够把影响因变量变并且能够把影响因变量变动的因素全部纳入方程动的因素全部纳入方程,这时相关关系也可转化为函这时相关关系也可转化为函数关系数关系.另外另外,相关关系也具有某种变动规律相关关系也具有某种变动规律,所以所以,相关关系也经常可以用一定的函数形式去近似地描相关关系也经常可以用一定的函数形式去近似地描述述.第17页/共132页18二、相关关系的种类1.按相关的程度分:完全相关不完全相关 不相关(或零相关)例:完全相关:在价格P不变的情况下,销售收入Y与销售量X
8、 的关系;不相关:股票价格的高低与气温的高低是不相关的;第18页/共132页192.按相关的方向分:正相关负相关正相关:两个变量之间的变化方向一致,都是增长趋正相关:两个变量之间的变化方向一致,都是增长趋 势或下降趋势。势或下降趋势。例例:收入与消费的关系收入与消费的关系;工人的工资随劳动生产率的提高而提高。工人的工资随劳动生产率的提高而提高。负相关:两个变量变化趋势相反,一个下降而另一负相关:两个变量变化趋势相反,一个下降而另一 个上升,或一个上升而另一个下降。个上升,或一个上升而另一个下降。例例:物价与消费的关系物价与消费的关系;商品流转的规模愈大商品流转的规模愈大,流通费用水平则越低。流
9、通费用水平则越低。第19页/共132页203.按相关的形式分:线性相关非线性相关 线性相关(直线相关):当一个变量每变动一个单位时,另一个变量按一个大致固定的 增(减)量变动。例:人均消费水平与人均收入水平非线性相关(曲线相关):当一个变量变动时,另一个变量也相应发生变动,但这种变动是不均等的。例:产品的平均成本与总产量;农产量与施肥量.第20页/共132页214.按相关的影响因素多少分:单相关复相关偏相关单相关(一元相关):只有一个自变量。复相关(多元相关):有两个及两个以上的自变量。如:居民的收入与储蓄额;成本与产量如:某种商品的需求与其价格水平以及收入水平 之间的相关关系便是一种复相关。
10、第21页/共132页22 偏相关:在某一现象与多种现象相关的场合,假定其他变量不变,专门考察其中两个变量的相关关系称为偏相关。如:在假定人们的收入水平不变的条件下,某种商品的需求与其价格水平的关系就是一种偏相关。第22页/共132页23 5.5.按相关的性质分:真实相关虚假相关真实相关是现象的内在联系所决定.虚假相关:如某人曾观察过某一国家历年的国内生产总值与精神病患者人数的关系,呈相当高的正相关.第23页/共132页24讨论下面的关系是因果关系还是伪关系?讨论下面的关系是因果关系还是伪关系?1.冰淇淋的销量与儿童出事故次数之间 2.街上警察数量与犯罪数量之间 3.历史上,妇女裙子的长度与经济
11、的好坏有关系:裙子越短,经济越景气。4.鹳的数量与丹麦乡间婴儿出生率的关系第24页/共132页25 不相关不相关不相关 负线性相关负线性相关负线性相关 正线性相关正线性相关正线性相关 非线性相关非线性相关非线性相关 完全负线性相关完全负线性相关完全负线性相关完全正线性相关完全正线性相关完全正线性相关 图示第25页/共132页26三、相关分析的主要内容确定现象之间是否存在相关关系,以及相关关系呈现的形态.确定相关关系的紧密程度.确定相关关系的数学表达式确定因变量估计值误差程度.预测或估计第26页/共132页27第二节 相关图表和相关系数一、相关表和相关图二、简单相关系数第27页/共132页28
12、相关分析:就是用一个指标来表明现象间相互依存关系的密切程度。广义的相关分析包括相关关系的分析(狭义的相关分析)和回归分析。第28页/共132页29定性分析是依据研究者的理论知识和实践经验,对客观现象之间是否存在相关关系,以及何种关系作出判断。定量分析在定性分析的基础上,通过编制相关表、绘制相关图、计算相关系数等方法,来判断现象之间相关的方向、形态及密切程度。相关关系的判断第29页/共132页30一、相关表和相关图 相关表和相关图是研究相关关系的直观工具,在进行详细的定量分析之前,可以先利用它们对现象之间存在的相关关系的方向、形式、和密切程度作大致的判断。第30页/共132页简单相关表:将自变量
13、x的数值按照从小到大的顺序,并配合因变量y的数值一一对应而平行排列的表。消费支出消费支出y15203040425360657870可支配收可支配收入入x18254560627588929899居民消费和收入的相关表单位:百元第31页/共132页32 相关图:又称散点图。将x置于横轴上,y置于纵轴上,将(x,y)绘于坐标图上。用来反映两变量之间相关关系的图形。例:第32页/共132页33例 :国家教育部决定将各高校的后勤社会化。某从事饮食业的企业家认为这是一个很好的投资机会,他得到十组高校人数与周边饭店的季销售额的数据资料,并想根据高校的数据决策其投资规模。第33页/共132页34二、简单相关系
14、数(一)简单相关系数的概念 是度量两个变量之间线性相关密切程度和相关方向的统计指标。包括简单相关系数、复相关系数、偏相关系数、曲线相关系数(相关指数).简单相关系数又称皮尔逊(1890年,英国)相关系数,或积矩相关系数或动差相关系数。若相关系数是根据总体全部数据计算的,称为总体 相关系数,记为 .若是根据样本数据计算的,则称为样本相关系数,记为 r.样本相关系数是总体相关系数的一致估计量.第34页/共132页35n 样本简单相关系数的计算公式(积差法)(二)简单相关系数的计算公式式中:(1)1.用计算器计算协方差S2xy第35页/共132页36(0,0)()+,+-,+-,-+,-第36页/共
15、132页37协方差S2xy的意义:1.相关系数的正负取决于协方差的正负.2.协方差可以表示变量x、y相关程度的大小.3.变量值的项数和计量单位对离差乘积之和 有影响.可见,相关系数是对变量离差标准化以后的协方差.第37页/共132页38(1)式可化简为如下公式:或:第38页/共132页39用计算机计算选取“工具”-“数据分析”选“相关系数”选“确定”输入“输入区域”输入“输出区域”在“分组方式”中选“逐列”选“标志位于第一行”确定出现结果如下:第39页/共132页40 1.r 的取值范围是-1,1|r|=1,为完全相关r=1,为完全正相关r=-1,为完全负相关 2.r=0,不存在线性相关关系
16、3.-1r0,为负相关 4.0 t t,拒绝,拒绝H H0 0 若若 t t t(10-2)=2.306,拒绝H0,总体人均消费支出与人均可支配收入之间的线性相关关系显著。例:第49页/共132页为了简化检验的过程,有人根据t统计量和r的关系,编成相关系数临界值表,相关系数的显著性检验可直接查表进行。检验方法:对于给定的显著性水平若IrI r (n-2),变量x与y之间有显著的线性相关关系。若IrI r (n-2),变量x与y之间不存在线性相关关系。前例中:r=0.9878 r0.05(10-2)=0.632 ,所以所以总体人均总体人均消费支出与人均可支配收入之间的线性相关关系显著。消费支出与
17、人均可支配收入之间的线性相关关系显著。第50页/共132页51相关系数检验表的使用 1.若IrI大于表上的=5%相应的值,小于表上1%相应的值,称变量x与y之间有显著的线性关系2.若IrI大于表上=1%相应的值,称变量x与y之间有十分显著的线性关系3.若IrI小于表上=5%相应的值,称变量x与y之间没有明显的线性关系第51页/共132页52 第三节 一元线性回归分析一、回归分析概念二、回归分析的种类三、一元线性回归分析第52页/共132页53回归方程一词是怎么来的第53页/共132页54一、回归分析的概念 对具有相关关系的现象,根据其相关关系的具体形态,选择一个合适的数学模型(称为回归方程式)
18、,用来近似地表达变量间的平均变化关系的一种统计分析方法。第54页/共132页55二、回归分析的内容1.从一组样本数据出发,确定变量之间的数学关系式。2.对这些关系式的可信程度进行各种统计检验,并从影响某一特定变量的诸多变量中找出哪些变量的影响显著,哪些不显著。3.利用所求的关系式,根据一个或几个变量的取值来预测或控制另一个特定变量的取值,并给出这种预测或控制的精确程度。第55页/共132页56回归分析和相关分析的区别:1.相关分析中,变量 x 变量 y 处于平等的地位;回归分析中,变量 y 称为因变量,处在被解释的地位,x 称为自变量,用于预测因变量的变化.(地位)2.相关分析中所涉及的变量
19、x 和 y 都是随机变量;回归分析中,因变量 y 是随机变量,自变量 x则作为研究时给定的非随机变量。(性质)3.相关分析主要是描述两个变量之间线性关系的密切程度;回归分析不仅可以揭示变量 x 对变量 y 的影响大小,还可以由回归方程进行预测和控制(作用)第56页/共132页57相关分析与回归分析的联系相关分析和回归分析有着密切的联系,它们不仅具有共同的研究对象,而且在具体应用时,常常必须互相补充。相关分析需要依靠回归分析来表明现象数量相关的具体形式,而回归分析则需要依靠相关分析来表明现象数量变化的相关程度。只有当变量之间存在着高度相关时,进行回归分析寻求其相关的具体形式才有意义。简单说:1、
20、相关分析是回归分析的基础和前提;2、回归分析是相关分析的深入和继续。第57页/共132页58三、回归分析的种类一个自变量一个自变量两个及两个以上自变量两个及两个以上自变量回归模型多元回归一元回归线性回归非线性回归线性回归非线性回归第58页/共132页59四、一元线性回归分析(一)一元线性回归方程1.当只涉及一个自变量时称为一元回归,若因变量 y 与自变量 x 之间为线性关 系时称为一元线性回归。2、对于具有线性关系的两个变量,可以用 一条线性方程来表示它们之间的关系。3、描述因变量 y 如何依赖于自变量 x 和 误差项 的方程称为回归模型。第59页/共132页60注意:在两个变量之间,必须确定
21、哪个是自变量,哪个是因变量回归方程的主要作用是用自变量来推算因变量。第60页/共132页61 回归模型的表达式如下:1、模型中,y 是 x 的线性函数(部分)加上随机误差项2、线性部分反映了由于 x 的变化而引起的 y 的变化,是Y的数学期望,即对应于X某一取值时Y的平均值:第61页/共132页623、随机误差项(随机干扰项)是随机变量A、反映了除 x 和 y 之间的线性关系 之外的随机因素对 y 的影响B、是不能由 x 和 y 之间的线性关系 所解释的变异性随机误差项是Y与E(Y)的离差:4、和 称为模型的参数第62页/共132页63由于总体回归参数、是未知的,因此必须利用样本数据去估计。用
22、样本统计量 代替回归方程中的未知参数、,就得到了估计的回归方程。一元线性回归中估计的回归方程为:式中:是直线的斜率,又称回归系数,它表示x每变动一个单位,y 的平均变动值。称为残差,与总体误差项 相互对应;是样本的容量。第63页/共132页64样本回归函数与总体回归函数区别样本回归函数与总体回归函数区别1、总体回归线是未知的,只有一条。样本回归线是根据样本数据拟合的,每抽取一组样本,便可以拟合一条样本回归线。2、总体回归函数中的 和是未知的参数,表现为常数。而样本回归函数中的 是随机变量,其具体数值随所抽取的样本观测值不同而变动。第64页/共132页653、总体回归函数中的 是与未知的总体回归
23、线之间的纵向距离,它是不可直接观测的。而样本回归函数中的是与样本回归线之间的纵向距离,当根据样本观测值拟合出样本回归线之后,可以计算出的具体数值。第65页/共132页66总体回归线与随机误差项 XYiY 。第66页/共132页67 一元线性回归模型的基本假定 -高斯(德国数学家)假定(标准假定)1.误差项是一个期望值为0的随机变量,即E()=0。对于一个给定的 x 值,y 的期望值为E(y)=a+x2.对于所有的 x 值,的方差2 都相同3.误差项是一个服从正态分布的随机变量,且相互独立。即N(0,2)独立性意味着对应于不同的 x 值的值不相关,因此,对应于不同的 x 值 的Y值也不相关.第6
24、7页/共132页68(二)回归参数的普通最小二乘估计(OLS)基本原理:1、使因变量的观察值 Y与估计值 之间的 离差平方和达到最小来求得。即2.用最小二乘法拟合的直线来代表x与y之间的 关系与实际数据的误差比其他任何直线都小。第68页/共132页69回归参数推导过程:为使Q 达到极小值,则须有:整理得如下标准方程组:第69页/共132页70解上述方程组得:其中 可变形为:第70页/共132页【例】根据例根据例2 2中数据,拟合人均消费支出对人均中数据,拟合人均消费支出对人均可支配收入的回归方程,并指出回归系数的含义。可支配收入的回归方程,并指出回归系数的含义。解:y 473,x 662,y2
25、 26507,x2 51656,xy 36933,n=10由表中数据得:所以:所建立的回归方程为:回归系数 的含义是:人均可支配收入每增加1元,人均消费支出平均增加0.72元。第71页/共132页72n根据例1中的数据,人均消费金额对人均国民收入的n回归方程为:y=54.22286+0.52638 x第72页/共132页73相关系数与回归系数的关系第73页/共132页74(三)回归方程的显著性检验1.回归模型检验的种类 回归模型的检验包括理论意义检验、一级检验和二级检验。理论意义:检验主要涉及参数估计值的符号和取值区间.如食品支出的恩格尔函数中,b的取值区间应在0-1之间;第74页/共132页
26、75一级检验又称统计学检验,它是利用统计学中的抽样理论来检验样本回归方程的可靠性,具体又可分为拟合程度评价和显著性检验.一级检验对所有的现象进行回归分析时都必须通过的检验.二级检验又称经济计量学检验,它是对标准线性回归模型的假定条件能否得到满足进行检验,具体包括序列相关检验,异方差性检验等.第75页/共132页76一级检验2.显著性检验包括两方面的内容:(1)对整个回归方程的显著性检验-F检验 回归方程的显著性检验即对自变量和因变量之间线性关系整体上是否显著进行检验。(2)对回归系数的显著性检验:-t检验第76页/共132页77 对整个回归方程的显著性检验-F检验 检验具体方法是将回归平方和(
27、SSR)同剩余平方和(SSE)加以比较,应用F检验来分析二者之间的差别是否显著。第77页/共132页781.提出假设 H0:(线性关系不显著)2.2.计算检验统计量计算检验统计量F F3.确定显著性水平,并根据分子自由度1和分母自由度n-2找出临界值F 4.作出决策:若FF,拒绝H0;若Ft,拒绝H0;t t=2.201,拒绝H0,表明人均收入与人均消费之间有线性关系例:对前例的回归系数进行显著性检验(0.05)第99页/共132页100回归系数的显著性检验(Excel输出的结果)第100页/共132页101(六).利用回归方程进行估计和预测1.根据自变量 x 的取值估计或预测因变量 y的取值
28、.2.当给出的x属于样本内的数据时,计算的yc值称为内插检验或事后预测,当给出的x在样本之外时,计算的yc值称为外推预测或事前预测.3.估计或预测的类型点估计y 的平均值的点估计y 的个别值的点估计区间估计y 的平均值的置信区间估计y 的个别值的预测区间估计第101页/共132页102点估计:2.点估计值 y 的平均值的点估计 y 的个别值的点估计3.在点估计条件下,平均值的点估计和个别值的的点估计是一样的,但在区间估计中则不同1.对对于于自自变变量量 x 的的一一个个给给定定值值x0,根根据据回回归归方方程得到因变量程得到因变量 y 的一个估计值的一个估计值第102页/共132页103 y
29、的平均值的点估计1.利用估计的回归方程,对于自变量 x 的一个给定值 x0,求出因变量 y 的平均值的一个估计值E(y0),就是平均值的点估计2.在前面的例子中,假如我们要估计人均国民收入为2000元时,所有年份人均消费金额的的平均值,就是平均值的点估计。根据估计的回归方程得第103页/共132页104 y 的个别值的点估计1.利用估计的回归方程,对于自变量 x 的一个给定值 x0,求出因变量 y 的一个个别值的估计值 ,就是个别值的点估计2.比如,如果我们只是想知道1990年人均国民收入为1250.7元时的人均消费金额是多少,则属于个别值的点估计。根据估计的回归方程得第104页/共132页1
30、05 区间估计:1.点估计不能给出估计的精度,点估计值与实际值之间是有误差的,因此需要进行区间估计2.对于自变量 x 的一个给定值 x0,根据回归方程得到因变量 y 的一个估计区间3.区间估计有两种类型置信区间估计预测区间估计第105页/共132页106 y 的平均值的置信区间估计 1.利用估计的回归方程,对于自变量 x 的一个给定值 x0,求出因变量 y 的平均值E(y0)的估计区间,这一估计区间称为置信区间2.E(y0)在1-置信水平下的置信区间为式式中中:S Sy y为为估估计计标标准误差准误差第106页/共132页107 【例】根据前例,求出人均国民收入为1250.7元时,人均消费金额
31、95%的置信区间 解:根据前面的计算结果 712.57,Sy=14.95,t(13-2)2.201,n=13 置信区间为人人 均均 消消 费费 金金 额额 95%95%的的 置置 信信 区区 间间 为为 702.305702.305元元 722.835722.835元之间元之间712.57712.57 10.26510.265第107页/共132页108 y 的个别值的预测区间估计 1.利用估计的回归方程,对于自变量 x 的一个给定值 x0,求出因变量 y 的一个个别值的估计区间,这一区间称为预测区间 2.y0在1-置信水平下的预测区间为注意!注意!第108页/共132页109【例】根据前例,
32、求出1990年人均国民收入为1250.7元时,人均消费金额的95%的预测区间 解:根据前面的计算结果有 712.57,Sy=14.95,t(13-2)2.201,n=13 置信区间为712.57712.57 34.46934.469人人 均均 消消 费费 金金 额额 95%95%的的 预预 测测 区区 间间 为为 678.101678.101元元 747.039747.039元之间元之间第109页/共132页110影响区间宽度的因素1.置信水平(1-)区间宽度随置信水平的增大而增大2.数据的离散程度(s)区间宽度随离散程度的增大而增大3.样本容量区间宽度随样本容量的增大而减小4.用于预测的 x
33、p与x的差异程度区间宽度随 xp与x 的差异程度的增大而增大第110页/共132页111置信区间、预测区间、回归方程xp pyx x预测上限预测上限置信上限预测下限预测下限置信下限第111页/共132页112第三节 多元线性相关与回归分析一、多元线性回归模型 一个因变量与两个及两个以上自变量之间的回归.描述因变量 y 如何依赖于自变量 x1,x2,xp 和误差项 的方程称为多元线性回归模型 涉及 p 个自变量的多元线性回归模型可表示为 0 ,1 1,p是参数 常数项,和Y构成的平面与Y轴的截距偏回归系数,表示在其他 固定时 每变化一个单位引起的Y的平均变动;第112页/共132页113 偏回归
34、系数,表示在其他 固定时 每变化 一个单位引起的Y的平均变动;是被称为误差项的随机变量 y 是x1,,x2,xp 的线性函数加上误差项 说明了包含在y里面但不能被p个自变量的线性关系所解释的变异性在多元回归模型中,还要求各自变量之间不存在显著相关,或高度相关也即不得存在多重共线性。第113页/共132页114多元线性回归模型 对于 n 组实际观察数据(yi;xi1,,xi2,xip),(i=1,2,n),多元线性回归模型可表示为y1=+1 1 x11+x12+px1p+1 1y2=+1 1 x21+x22+px2p+yn=+1 1 xn1+xn2+pxnp+n 第114页/共132页115二、
35、参数的最小二乘法2.根据最小二乘法的要求,可得求解各回归参数 的标准方程如下1.使因变量的观察值与估计值之间的离差平方和达到最小来求得 。即第115页/共132页116三、回归方程的显著性检验 (线性关系的检验)1.检验因变量与所有的自变量和之间的是否存在一个显著的线性关系,也被称为总体的显著性检验2.检验方法是将回归离差平方和(SSR)同剩余离差平方和(SSE)加以比较,应用 F 检验来分析二者之间的差别是否显著如果是显著的,因变量与自变量之间存在线性关系如果不显著,因变量与自变量之间不存在线性关系第116页/共132页117步骤:1.提出假设H0:12p=0 线性关系不显著H1:1,2,p
36、至少有一个不等于02.计算检验统计量F3.确定显著性水平 和分子自由度p、分母自由度n-p-1找出临界值F 4.作出决策:若F F ,拒绝H0;若FF,接受H0第117页/共132页118回归系数的显著性检验(要点)1.如果F检验已经表明了回归模型总体上是显著的,那么回归系数的检验就是用来确定每一个单个的自变量 xi 对因变量 y 的影响是否显著2.对每一个自变量都要单独进行检验3.应用 t 检验4.在多元线性回归中,回归方程的显著性检验不再等价于回归系数的显著性检验。第118页/共132页119回归系数的显著性检验(步骤)1.提出假设H0:i=0 (自变量 xi 与 因变量 y 没有线性关系
37、)H1:i 0 (自变量 xi 与 因变量 y有线性关系)2.计算检验的统计量 t3.确定显著性水平,并进行决策 tt,拒绝H0;t t,接受H0第119页/共132页120第四节非线性相关与回归分析一、非线性函数形式的确定 在对实际的客观现象进行定量分析时,选择回归方程的具体形式应遵循以下原则:首先,方程形式应与有关实质性科学的基本理论相一致。例如,采用幂函数的形式,能够较好地表现生产函数;采用多项式方程能够较好地反映总成本与总产量之间的关系等等。第120页/共132页121 -其次,方程有较高的拟合程度。因为只有这样,才能说明回归方程可以较好地反映现实经济的运行情况。-最后,方程的数学形式
38、要尽可能简单。如果几种形式都能基本符合上述两项要求,则应该选择其中数学形式较简单的一种。一般来说,数学形式越简单,其可操作性就越强。第121页/共132页122(一)抛物线函数(二)双曲线函数(三)幂函数(四)指数函数(五)对数函数(六)形曲线函数(七)多项式方程第122页/共132页123几种常见的非线性模型 指数函数2.线性化方法两端取对数得:lny=ln +x令:y=lny,则有y=ln +x1.基本形式:3.图像 第123页/共132页124 幂函数2.线性化方法两端取对数得:lg y=lg +lg x令:y=lgy,x=lg x,则y=lg +x1.基本形式:3.图像00 1 1 1
39、 1 =1=1-1-1 0 0 -1-1 =-1=-1 第124页/共132页125 双曲线函数2.线性化方法令:y=1/y,x=1/x,则有y=+x1.基本形式:3.图像 0 0第125页/共132页126 对数函数2.线性化方法x=lgx,则有y=+x1.基本形式:3.图像 0 0 0 0 第126页/共132页127 S 型曲线2.线性化方法令:y=1/y,x=e-x,则有y=+x1.基本形式:3.图像第127页/共132页128非线性回归(实例)【例】为研究生产率与废品率之间的关系,记录数据如下表。试拟合适当的模型。废品率与生产率的关系生产率(周生产率(周/单位单位)x100020003000 3500400045005000废品率(废品率(%)y5.26.56.88.110.210.313.0第128页/共132页129生产率与废品率的散点图第129页/共132页130非线性回归(实例)1.用线性模型:y=01x+,有y=2.671+0.0018x2.用指数模型:y=x ,有y=4.05(1.0002)x3.比较直线的残差平方和5.3371指数模型的残差平方和6.11。直线模型略好于指数模型第130页/共132页131第131页/共132页132感谢您的观看!第132页/共132页