《SPSS 实用教程回归分析教案.pptx》由会员分享,可在线阅读,更多相关《SPSS 实用教程回归分析教案.pptx(187页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、会计学1SPSS 实用教程实用教程 回归分析回归分析回归分析基本概念回归分析基本概念7.1一元线性回归分析一元线性回归分析7.2多元线性回归分析多元线性回归分析7.3非线性回归分析非线性回归分析7.4曲曲 线线 估估 计计7.5时间序列的曲线估计时间序列的曲线估计7.6含虚拟自变量的回归分析含虚拟自变量的回归分析7.7含虚拟自变量的回归分析含虚拟自变量的回归分析7.8第1页/共187页 在数量分析中,经常会看到变量与变量在数量分析中,经常会看到变量与变量之间存在着一定的联系。要了解变量之间如之间存在着一定的联系。要了解变量之间如何发生相互影响的,就需要利用相关分析和何发生相互影响的,就需要利用
2、相关分析和回归分析。在上一章讲述了相关分析有关内回归分析。在上一章讲述了相关分析有关内容。本章介绍回归分析基本概念,回归分析容。本章介绍回归分析基本概念,回归分析的主要类型:一元线性回归分析、多元线性的主要类型:一元线性回归分析、多元线性回归分析、非线性回归分析、曲线估计、时回归分析、非线性回归分析、曲线估计、时间序列的曲线估计、含虚拟自变量的回归分间序列的曲线估计、含虚拟自变量的回归分析以及逻辑回归分析等。析以及逻辑回归分析等。第2页/共187页7.1 7.1 回归分析基本概念回归分析基本概念 相关分析和回归分析都是研究变量间关相关分析和回归分析都是研究变量间关系的统计学课题。在应用中,两种
3、分析方法系的统计学课题。在应用中,两种分析方法经常相互结合和渗透,但它们研究的侧重点经常相互结合和渗透,但它们研究的侧重点和应用面不同。和应用面不同。在回归分析中,变量在回归分析中,变量y y称为因变量,处称为因变量,处于被解释的特殊地位;而在相关分析中,变于被解释的特殊地位;而在相关分析中,变量量y y与变量与变量x x处于平等的地位,研究变量处于平等的地位,研究变量y y与变与变量量x x的密切程度和研究变量的密切程度和研究变量x x与变量与变量y y的密切程的密切程度是一样的。度是一样的。第3页/共187页 在回归分析中,因变量在回归分析中,因变量y y是随机变量,是随机变量,自变量自变
4、量x x可以是随机变量,也可以是非随机的可以是随机变量,也可以是非随机的确定变量;而在相关分析中,变量确定变量;而在相关分析中,变量x x和变量和变量y y都是随机变量。都是随机变量。相关分析是测定变量之间的关系密切相关分析是测定变量之间的关系密切程度,所使用的工具是相关系数;而回归分程度,所使用的工具是相关系数;而回归分析则是侧重于考察变量之间的数量变化规律,析则是侧重于考察变量之间的数量变化规律,并通过一定的数学表达式来描述变量之间的并通过一定的数学表达式来描述变量之间的关系,进而确定一个或者几个变量的变化对关系,进而确定一个或者几个变量的变化对另一个特定变量的影响程度。另一个特定变量的影
5、响程度。第4页/共187页 具体地说,回归分析主要解决以下几方具体地说,回归分析主要解决以下几方面的问题。面的问题。通过分析大量的样本数据,确定变量通过分析大量的样本数据,确定变量之间的数学关系式。之间的数学关系式。对所确定的数学关系式的可信程度进对所确定的数学关系式的可信程度进行各种统计检验,并区分出对某一特定变量行各种统计检验,并区分出对某一特定变量影响较为显著的变量和影响不显著的变量。影响较为显著的变量和影响不显著的变量。利用所确定的数学关系式,根据一个利用所确定的数学关系式,根据一个或几个变量的值来预测或控制另一个特定变或几个变量的值来预测或控制另一个特定变量的取值,并给出这种预测或控
6、制的精确度。量的取值,并给出这种预测或控制的精确度。第5页/共187页 作为处理变量之间关系的一种统计方法作为处理变量之间关系的一种统计方法和技术,回归分析的基本思想和方法以及和技术,回归分析的基本思想和方法以及“回归(回归(RegressionRegression)”名称的由来都要归功名称的由来都要归功于英国统计学家于英国统计学家F FGaltonGalton(1822182219111911)。)。第6页/共187页 在实际中,根据变量的个数、变量的类在实际中,根据变量的个数、变量的类型以及变量之间的相关关系,回归分析通常型以及变量之间的相关关系,回归分析通常分为一元线性回归分析、多元线性
7、回归分析、分为一元线性回归分析、多元线性回归分析、非线性回归分析、曲线估计、时间序列的曲非线性回归分析、曲线估计、时间序列的曲线估计、含虚拟自变量的回归分析和逻辑回线估计、含虚拟自变量的回归分析和逻辑回归分析等类型。归分析等类型。第7页/共187页7.2 7.2 一元线性回归分析一元线性回归分析 定义:一元线性回归分析是在排除其他定义:一元线性回归分析是在排除其他影响因素或假定其他影响因素确定的条件下,影响因素或假定其他影响因素确定的条件下,分析某一个因素(自变量)是如何影响另一分析某一个因素(自变量)是如何影响另一事物(因变量)的过程,所进行的分析是比事物(因变量)的过程,所进行的分析是比较
8、理想化的。其实,在现实社会生活中,任较理想化的。其实,在现实社会生活中,任何一个事物(因变量)总是受到其他多种事何一个事物(因变量)总是受到其他多种事物(多个自变量)的影响。物(多个自变量)的影响。第8页/共187页第9页/共187页第10页/共187页第11页/共187页第12页/共187页第13页/共187页第14页/共187页 在实际问题中,由于所要研究的现象的在实际问题中,由于所要研究的现象的总体单位数一般是很多的,在许多场合甚至总体单位数一般是很多的,在许多场合甚至是无限的,因此无法掌握因变量是无限的,因此无法掌握因变量y y总体的全部总体的全部取值。也就是说,总体回归方程事实上是未
9、取值。也就是说,总体回归方程事实上是未知的,需要利用样本的信息对其进行估计。知的,需要利用样本的信息对其进行估计。显然,样本回归方程的函数形式应与总体回显然,样本回归方程的函数形式应与总体回归方程的函数形式一致。归方程的函数形式一致。第15页/共187页第16页/共187页第17页/共187页第18页/共187页第19页/共187页第20页/共187页第21页/共187页第22页/共187页第23页/共187页第24页/共187页第25页/共187页第26页/共187页第27页/共187页第28页/共187页第29页/共187页 通过样本数据建立一个回归方程后,不通过样本数据建立一个回归方程后
10、,不能立即就用于对某个实际问题的预测。因为,能立即就用于对某个实际问题的预测。因为,应用最小二乘法求得的样本回归直线作为对应用最小二乘法求得的样本回归直线作为对总体回归直线的近似,这种近似是否合理,总体回归直线的近似,这种近似是否合理,必须对其作各种统计检验。一般经常作以下必须对其作各种统计检验。一般经常作以下的统计检验。的统计检验。第30页/共187页 (1 1)拟合优度检验)拟合优度检验 回归方程的拟合优度检验就是要检验样回归方程的拟合优度检验就是要检验样本数据聚集在样本回归直线周围的密集程度,本数据聚集在样本回归直线周围的密集程度,从而判断回归方程对样本数据的代表程度。从而判断回归方程对
11、样本数据的代表程度。第31页/共187页 回归方程的拟合优度检验一般用判定系回归方程的拟合优度检验一般用判定系数数R2R2实现。该指标是建立在对总离差平方和实现。该指标是建立在对总离差平方和进行分解的基础之上。进行分解的基础之上。第32页/共187页 (2 2)回归方程的显著性检验()回归方程的显著性检验(F F检验)检验)回归方程的显著性检验是对因变量与所回归方程的显著性检验是对因变量与所有自变量之间的线性关系是否显著的一种假有自变量之间的线性关系是否显著的一种假设检验。设检验。回归方程的显著性检验一般采用回归方程的显著性检验一般采用F F检验,利用检验,利用方差分析的方法进行。方差分析的方
12、法进行。第33页/共187页第34页/共187页 (3 3)回归系数的显著性检验()回归系数的显著性检验(t t检验)检验)所谓回归系数的显著性检验,就是根据所谓回归系数的显著性检验,就是根据样本估计的结果对总体回归系数的有关假设样本估计的结果对总体回归系数的有关假设进行检验。进行检验。之所以对回归系数进行显著性检验,是之所以对回归系数进行显著性检验,是因为回归方程的显著性检验只能检验所有回因为回归方程的显著性检验只能检验所有回归系数是否同时与零有显著性差异,它不能归系数是否同时与零有显著性差异,它不能保证回归方程中不包含不能较好解释说明因保证回归方程中不包含不能较好解释说明因变量变化的自变量
13、。因此,可以通过回归系变量变化的自变量。因此,可以通过回归系数显著性检验对每个回归系数进行考察。数显著性检验对每个回归系数进行考察。第35页/共187页 回归参数显著性检验的基本步骤。回归参数显著性检验的基本步骤。提出假设提出假设 计算回归系数的计算回归系数的t t统计量值统计量值 根据给定的显著水平根据给定的显著水平确定临界值,确定临界值,或者计算或者计算t t值所对应的值所对应的p p值值 作出判断作出判断第36页/共187页 研究问题研究问题 合成纤维的强度与其拉伸倍数有关,测合成纤维的强度与其拉伸倍数有关,测得试验数据如表得试验数据如表7-17-1所示。求合成纤维的强度所示。求合成纤维
14、的强度与拉伸倍数之间是否存在显著的线性相关关与拉伸倍数之间是否存在显著的线性相关关系。系。第37页/共187页表表表表7-17-1强度与拉伸倍数的试验数据强度与拉伸倍数的试验数据强度与拉伸倍数的试验数据强度与拉伸倍数的试验数据序序 号号拉拉 伸伸 倍倍 数数强度(强度(kg/mm2)12.01.622.52.432.72.543.52.754.03.564.54.275.25.086.36.497.16.5108.07.3119.08.01210.08.1第38页/共187页 实现步骤实现步骤图图图图7-1 7-1 在菜单中选择在菜单中选择在菜单中选择在菜单中选择“Linear”Linear”
15、命令命令命令命令第39页/共187页图图图图7-2 “Linear Regression”7-2 “Linear Regression”对话框(一)对话框(一)对话框(一)对话框(一)第40页/共187页图图图图7-3 “Linear Regression7-3 “Linear Regression:Statistics”Statistics”对话框对话框对话框对话框第41页/共187页 图图图图7-4 “Linear Regression7-4 “Linear Regression:Plots”Plots”对话框对话框对话框对话框 第42页/共187页图图图图7-5 “Linear Regr
16、ession7-5 “Linear Regression:Save”Save”对话框对话框对话框对话框 第43页/共187页图图图图7-6 “Linear Regression7-6 “Linear Regression:Options”Options”对话框对话框对话框对话框 第44页/共187页 (1 1)输出结果文件中的第一个表格如下)输出结果文件中的第一个表格如下表所示。表所示。第45页/共187页 (2 2)输出的结果文件中第二个表格如下)输出的结果文件中第二个表格如下表所示。表所示。第46页/共187页 (3 3)输出的结果文件中第三个表格如下)输出的结果文件中第三个表格如下表所示
17、。表所示。第47页/共187页 (4 4)输出的结果文件中第四个表格如下)输出的结果文件中第四个表格如下表所示。表所示。第48页/共187页7.3 7.3 多元线性回归分析多元线性回归分析统计学上的定义和计算公式统计学上的定义和计算公式 定义:在上一节中讨论的回归问题只涉定义:在上一节中讨论的回归问题只涉及了一个自变量,但在实际问题中,影响因及了一个自变量,但在实际问题中,影响因变量的因素往往有多个。例如,商品的需求变量的因素往往有多个。例如,商品的需求除了受自身价格的影响外,还要受到消费者除了受自身价格的影响外,还要受到消费者收入、其他商品的价格、消费者偏好等因素收入、其他商品的价格、消费者
18、偏好等因素的影响;影响水果产量的外界因素有平均气的影响;影响水果产量的外界因素有平均气温、平均日照时数、平均湿度等。温、平均日照时数、平均湿度等。第49页/共187页 因此,在许多场合,仅仅考虑单个变量因此,在许多场合,仅仅考虑单个变量是不够的,还需要就一个因变量与多个自变是不够的,还需要就一个因变量与多个自变量的联系来进行考察,才能获得比较满意的量的联系来进行考察,才能获得比较满意的结果。这就产生了测定多因素之间相关关系结果。这就产生了测定多因素之间相关关系的问题。的问题。第50页/共187页 研究在线性相关条件下,两个或两个以研究在线性相关条件下,两个或两个以上自变量对一个因变量的数量变化
19、关系,称上自变量对一个因变量的数量变化关系,称为多元线性回归分析,表现这一数量关系的为多元线性回归分析,表现这一数量关系的数学公式,称为多元线性回归模型。多元线数学公式,称为多元线性回归模型。多元线性回归模型是一元线性回归模型的扩展,其性回归模型是一元线性回归模型的扩展,其基本原理与一元线性回归模型类似,只是在基本原理与一元线性回归模型类似,只是在计算上更为复杂,一般需借助计算机来完成。计算上更为复杂,一般需借助计算机来完成。第51页/共187页第52页/共187页第53页/共187页第54页/共187页第55页/共187页第56页/共187页第57页/共187页第58页/共187页 对多元线
20、性回归,也需要测定方程的拟对多元线性回归,也需要测定方程的拟合程度、检验回归方程和回归系数的显著性。合程度、检验回归方程和回归系数的显著性。(1 1)拟合优度检验)拟合优度检验 测定多元线性回归的拟合程度,与一元测定多元线性回归的拟合程度,与一元线性回归中的判定系数类似,使用多重判定线性回归中的判定系数类似,使用多重判定系数,其定义为系数,其定义为第59页/共187页 (2 2)回归方程的显著性检验()回归方程的显著性检验(F F检验)检验)多元线性回归方程的显著性检验一般采多元线性回归方程的显著性检验一般采用用F F检验,利用方差分析的方法进行。检验,利用方差分析的方法进行。第60页/共18
21、7页 (3 3)回归系数的显著性检验()回归系数的显著性检验(t t检验)检验)回归系数的显著性检验是检验各自变量回归系数的显著性检验是检验各自变量x x1 1,x x2 2,对因变量,对因变量y y的影响是否显著,从而找的影响是否显著,从而找出哪些自变量对出哪些自变量对y y的影响是重要的,哪些是不的影响是重要的,哪些是不重要的。重要的。与一元线性回归一样,要检验解释变量与一元线性回归一样,要检验解释变量对因变量对因变量y y的线性作用是否显著,要使用的线性作用是否显著,要使用t t检检验。验。第61页/共187页 研究问题研究问题 用多元回归分析来分析用多元回归分析来分析3636个员工多个
22、心个员工多个心理变量值(理变量值(z1z1z8z8)对员工满意度)对员工满意度mymy的预测的预测效果,测得试验数据如表效果,测得试验数据如表7-27-2所示。所示。第62页/共187页表表表表7-27-2员工多个心理变量值和员工满意度数据员工多个心理变量值和员工满意度数据员工多个心理变量值和员工满意度数据员工多个心理变量值和员工满意度数据z1z2z3z4z5z6z7Z8满满 意意 度度66.0064.0062.0050.0058.0056.001.081.0025.0055.0050.0059.0059.0053.0051.001.001.1122.0050.0047.0049.0045.0
23、046.0046.001.311.2020.0055.0059.0050.0054.0052.0069.001.001.0020.0055.0059.0048.0056.0047.0050.001.001.0024.0062.0054.0068.0046.0046.0051.001.081.0023.0060.0060.0056.0053.0052.0051.001.081.0021.0052.0052.0069.0058.0057.0062.001.001.0023.0056.0055.0057.0039.0044.0046.001.691.0015.0050.0050.0068.0046.
24、0045.0056.001.081.1425.0058.0054.0060.0059.0052.0051.001.001.0025.0053.0052.0055.0057.0065.0064.001.081.0022.0052.0056.0053.0057.0063.0051.001.461.4320.0056.0065.0052.0051.0062.0047.001.001.0022.0050.0063.0059.0053.0055.0048.001.001.0020.0063.0057.0060.0066.0051.0056.001.001.0026.0056.0046.0058.0050
25、.0045.0052.002.231.2921.0047.0050.0057.0049.0050.0048.002.081.1420.0053.0066.0053.0059.0055.0045.001.001.0025.00第63页/共187页z1z2z3z4z5z6z7z8满满 意意 度度61.0055.0058.0061.0058.0061.001.151.1423.0059.0064.0060.0052.0054.0056.001.081.0026.0055.0060.0072.0060.0055.0067.001.081.0026.0056.0052.0068.0040.0051.00
26、55.001.851.7130.0059.0051.0061.0056.0052.0056.001.001.0025.0060.0053.0062.0055.0047.0063.001.311.1427.0052.0051.0057.0045.0055.0059.001.231.1420.0056.0057.0057.0052.0059.0055.001.001.1426.0068.0058.0071.0068.0053.0061.001.001.0030.0060.0053.0061.0060.0056.0051.001.001.0027.0064.0056.0074.0050.0059.0
27、057.001.851.1418.0067.0053.0060.0053.0053.0051.001.001.0024.0056.0056.0067.0067.0056.0052.001.001.0024.0053.0046.0049.0043.0050.0048.001.311.1419.0053.0057.0065.0052.0067.0059.001.771.4317.0060.0040.0071.0057.0056.0058.001.081.0024.0054.0045.0044.0049.0042.0046.001.001.0023.00第64页/共187页 实现步骤实现步骤图图图图
28、7-7 “Linear Regression”7-7 “Linear Regression”对话框(二)对话框(二)对话框(二)对话框(二)第65页/共187页 (1 1)输出结果文件中的第一个表格如下)输出结果文件中的第一个表格如下表所示。表所示。结果和讨论结果和讨论第66页/共187页 2 2)输出的结果文件中第二个表格如下表)输出的结果文件中第二个表格如下表所示。所示。第67页/共187页 (3 3)输出的结果文件中第三个表格如下)输出的结果文件中第三个表格如下表所示。表所示。第68页/共187页 (4 4)输出的结果文件中第四个表格如下)输出的结果文件中第四个表格如下表所示。表所示。第
29、69页/共187页 (5 5)输出的结果文件中第五个表格如下)输出的结果文件中第五个表格如下表所示。表所示。第70页/共187页 (6 6)输出的结果文件中第六个表格为回)输出的结果文件中第六个表格为回归系数分析,如下表所示归系数分析,如下表所示 第71页/共187页 (7 7)输出的结果文件中第七个表格如下)输出的结果文件中第七个表格如下表所示。表所示。第72页/共187页 (8 8)输出的结果文件中第八部分为图形,)输出的结果文件中第八部分为图形,为回归因变量和每个自变量之间的关系点图。为回归因变量和每个自变量之间的关系点图。图图7-87-8为自变量为自变量z1z1和和mymy之间的关系点
30、图。之间的关系点图。第73页/共187页统计学上的定义和计算公式统计学上的定义和计算公式7.4 7.4 非线性回归分析非线性回归分析 定义:研究在非线性相关条件下,自变定义:研究在非线性相关条件下,自变量对因变量的数量变化关系,称为非线性回量对因变量的数量变化关系,称为非线性回归分析。归分析。在实际问题中,变量之间的相关关系往在实际问题中,变量之间的相关关系往往不是线性的,而是非线性的,因而不能用往不是线性的,而是非线性的,因而不能用线性回归方程来描述它们之间的相关关系,线性回归方程来描述它们之间的相关关系,而要采用适当的非线性回归分析。而要采用适当的非线性回归分析。第74页/共187页 非线
31、性回归问题大多数可以化为线性回非线性回归问题大多数可以化为线性回归问题来求解,也就是通过对非线性回归模归问题来求解,也就是通过对非线性回归模型进行适当的变量变换,使其化为线性模型型进行适当的变量变换,使其化为线性模型来求解。一般步骤为:来求解。一般步骤为:第75页/共187页 根据经验或者绘制散点图,选择适当根据经验或者绘制散点图,选择适当的非线性回归方程;的非线性回归方程;通过变量置换,把非线性回归方程化为通过变量置换,把非线性回归方程化为线性回归;线性回归;用线性回归分析中采用的方法来确定各用线性回归分析中采用的方法来确定各回归系数的值;回归系数的值;对各系数进行显著性检验。对各系数进行显
32、著性检验。第76页/共187页 计算公式如下。计算公式如下。在本节中介绍几种常见的非线性回归模在本节中介绍几种常见的非线性回归模型,并分别给出其线性化方法及图形。型,并分别给出其线性化方法及图形。第77页/共187页第78页/共187页第79页/共187页第80页/共187页第81页/共187页第82页/共187页第83页/共187页第84页/共187页第85页/共187页 研究问题研究问题 研究民用汽车总量与国内生产总值的关研究民用汽车总量与国内生产总值的关系。数据如表系。数据如表7-37-3所示。(资料来源:所示。(资料来源:中国中国统计年鉴统计年鉴20072007,中国统计出版社,中国统
33、计出版社,20072007年)年)中实现过程中实现过程第86页/共187页 实现步骤实现步骤图图图图7-9 “Simple Scatterplot”7-9 “Simple Scatterplot”对话框对话框对话框对话框第87页/共187页图图图图7-10 7-10 散点图散点图散点图散点图第88页/共187页图图图图7-11 “Curve Estimation”7-11 “Curve Estimation”对话框(一)对话框(一)对话框(一)对话框(一)第89页/共187页结果和讨论结果和讨论 (1 1)第一部分输出相关统计量和参数的)第一部分输出相关统计量和参数的值,如下表所示。值,如下表
34、所示。第90页/共187页 (2 2)第二部分输出的是观察值和)第二部分输出的是观察值和CubicCubic,PowerPower两种曲线预测值的对比图,如图两种曲线预测值的对比图,如图7-127-12所示。所示。第91页/共187页7.5 7.5 曲曲 线线 估估 计计 定义:在一元回归分析中,一般首先绘定义:在一元回归分析中,一般首先绘制自变量和因变量间的散点图,然后通过数制自变量和因变量间的散点图,然后通过数据在散点图中的分布特点选择所要进行回归据在散点图中的分布特点选择所要进行回归分析的类型,是使用线性回归分析还是某种分析的类型,是使用线性回归分析还是某种非线性的回归分析。非线性的回归
35、分析。第92页/共187页 然而,在实际问题中,用户往往不能确然而,在实际问题中,用户往往不能确定究竟该选择何种函数模型更接近样本数据,定究竟该选择何种函数模型更接近样本数据,这时可以采用曲线估计的方法,其步骤如下:这时可以采用曲线估计的方法,其步骤如下:第93页/共187页 首先根据实际问题本身特点,同时选首先根据实际问题本身特点,同时选择几种模型;择几种模型;然后然后SPSSSPSS自动完成模型的参数估计,自动完成模型的参数估计,并显示并显示R2R2、F F检验值、相伴概率值等统计量;检验值、相伴概率值等统计量;最后,选择具有最后,选择具有R2R2统计量值最大的模统计量值最大的模型作为此问
36、题的回归模型,并作一些预测。型作为此问题的回归模型,并作一些预测。第94页/共187页第95页/共187页第96页/共187页 研究问题研究问题 试用试用SPSSSPSS对国内生产总值和社会消费品对国内生产总值和社会消费品零售总额之间的关系进行曲线回归分析。数零售总额之间的关系进行曲线回归分析。数据如表据如表7-47-4所示。(资料来源:所示。(资料来源:中国统计年中国统计年鉴鉴20072007,中国统计出版社,中国统计出版社,20072007年)年)中实现过程中实现过程第97页/共187页表表表表7-47-41978197820062006年社会消费品零售总额年社会消费品零售总额年社会消费品
37、零售总额年社会消费品零售总额年年 份份国内生产总值(亿元)国内生产总值(亿元)社会消费品零售总额(亿元)社会消费品零售总额(亿元)19783645.21558.619794062.61800.019804545.62140.019814891.62350.019825323.42570.019835962.72849.419847208.13376.419859016.04305.0198610275.24950.0198712058.65820.0198815042.87440.0198916992.38101.4199018667.88300.1199121781.59415.619922
38、6923.510993.7199335333.912462.1199448197.916264.7199560793.720620.0199671176.624774.1199778973.027298.9199884402.329152.5199989677.131134.7200099214.634152.62001109655.237595.22002120332.748135.92003135822.852516.32004159878.359501.02005183867.967176.62006210871.076410.0第98页/共187页 实现步骤实现步骤图图图图7-13 “
39、Curve Estimation”7-13 “Curve Estimation”对话框(二)对话框(二)对话框(二)对话框(二)第99页/共187页图图图图7-14 “Curve Estimation7-14 “Curve Estimation:Save”Save”对话框(一)对话框(一)对话框(一)对话框(一)第100页/共187页 (1 1)SPSSSPSS输出结果文件中的第一部分如输出结果文件中的第一部分如下表所示。下表所示。第101页/共187页 (2 2)输出的结果文件中第二部分如图)输出的结果文件中第二部分如图7-7-1515所示。所示。第102页/共187页 (3 3)由于进行曲
40、线估计时所选的曲线模)由于进行曲线估计时所选的曲线模型种类较多,所以使得输出的观察值与在各型种类较多,所以使得输出的观察值与在各种函数模型条件下预测值的对比图比较复杂,种函数模型条件下预测值的对比图比较复杂,不易分辨出究竟不易分辨出究竟LinearLinear,QuadraticQuadratic,CubicCubic及及PowerPower这这4 4种曲线究竟哪种的对样本观察值种曲线究竟哪种的对样本观察值的拟合优度更符合实际。的拟合优度更符合实际。第103页/共187页图图图图7-16 7-16 对比图对比图对比图对比图2 2第104页/共187页 (4 4)重新回到图)重新回到图7-137
41、-13所示对话框,在所示对话框,在“ModelModel”框内只选中框内只选中“QuadraticQuadratic”和和“CubicCubic”这两种拟合优度更高的曲线模型进这两种拟合优度更高的曲线模型进行估计。得出它们与观察值的对比图,如图行估计。得出它们与观察值的对比图,如图7-177-17所示。所示。第105页/共187页图图图图7-17 7-17 对比图对比图对比图对比图3 3第106页/共187页 (5 5)如果在图)如果在图7-137-13所示对话框中选中了所示对话框中选中了“Display ANOVA tableDisplay ANOVA table”项,作回归方程显项,作回归
42、方程显著性检验,将输出相应的方差分析表,以著性检验,将输出相应的方差分析表,以CubicCubic模型为例(如下表所示),其结果是:模型为例(如下表所示),其结果是:回归方程显著有意义,并且回归方程显著有意义,并且x,x2,x3x,x2,x3三个自变三个自变量的系数显著不为零。量的系数显著不为零。第107页/共187页第108页/共187页第109页/共187页第110页/共187页 (6 6)由于在图)由于在图7-137-13所示对话框中选了所示对话框中选了“SaveSave”项,且在图项,且在图7-147-14所示的所示的“Save Save VariablesVariables”框中选择
43、了框中选择了“Predicted Predicted valuesvalues”,“ResidualsResiduals”和和“Prediction Prediction intervalsintervals”3 3个选项,因此在个选项,因此在SPSSSPSS数据编辑数据编辑窗口中就增了窗口中就增了fit_1fit_1,err_1err_1,lcl_1lcl_1,ucl_1ucl_1等等4444个变量的值,如图个变量的值,如图7-187-18所示。所示。第111页/共187页图图图图7-18 7-18 曲线估计分析结果保存曲线估计分析结果保存曲线估计分析结果保存曲线估计分析结果保存第112页/
44、共187页7.6 7.6 时间序列的曲线估计时间序列的曲线估计 定义:时间序列的曲线估计是分析社会定义:时间序列的曲线估计是分析社会和经济现象中经常用到的一种曲线估计。通和经济现象中经常用到的一种曲线估计。通常把时间设为自变量常把时间设为自变量x x,代表具体的经济或社,代表具体的经济或社会现象的变量设为因变量会现象的变量设为因变量y y,研究变量,研究变量x x与与y y之之间关系的方法就是时间序列曲线估计。其具间关系的方法就是时间序列曲线估计。其具体步骤与一般的曲线估计基本类似。体步骤与一般的曲线估计基本类似。计算公式:计算公式:SPSSSPSS中时间序列的曲线估计中时间序列的曲线估计模型
45、与上一节所介绍相同。模型与上一节所介绍相同。第113页/共187页 研究问题研究问题 试用试用SPSSSPSS对对1978197820062006年间社会消费品年间社会消费品零售总额之间的关系进行曲线回归分析。数零售总额之间的关系进行曲线回归分析。数据如表据如表7-57-5所示。(资料来源:所示。(资料来源:中国统计年中国统计年鉴鉴20072007,中国统计出版社,中国统计出版社,20072007年)年)第114页/共187页表表表表7-57-51978197820062006年社会消费品零售总额年社会消费品零售总额年社会消费品零售总额年社会消费品零售总额 序序 号号年年 份份社会消费品零售总
46、额(亿元)社会消费品零售总额(亿元)119781558.6219791800.0319802140.0419812350.0519822570.0619832849.4719843376.4819854305.0919864950.01019875820.01119887440.01219898101.41319908300.11419919415.615199210993.716199314270.417199418622.918199523613.819199628360.220199731252.921199833378.122199935647.923200039105.7242001
47、43055.425200248135.926200352516.327200459501.028200567176.629200676410.0第115页/共187页 实现步骤实现步骤图图图图7-19 “Curve Estimation”7-19 “Curve Estimation”对话框(三)对话框(三)对话框(三)对话框(三)第116页/共187页图图图图7-20 “Curve Estimation7-20 “Curve Estimation:Save”Save”对话框(二)对话框(二)对话框(二)对话框(二)第117页/共187页 (1 1)第一部分输出相关统计量和参数的)第一部分输出相
48、关统计量和参数的值如下表所示。值如下表所示。第118页/共187页 (2 2)第二部分输出的是观察值)第二部分输出的是观察值LinearLinear,CubicCubic,PowerPower和和Exponential 4Exponential 4种曲线预测值种曲线预测值的对比图,如图的对比图,如图7-217-21所示。所示。第119页/共187页 (3 3)由于在图)由于在图7-197-19所示所示“Curve Curve EstimationEstimation”对话框(三)中选了对话框(三)中选了“SaveSave”项,且在图项,且在图7-207-20的的“Save VariablesS
49、ave Variables”框中框中选择了选择了“Predicted valuesPredicted values”选项和选项和“Predict CasesPredict Cases”框中选择了框中选择了“Predict Predict throughthrough”项,并且在项,并且在“ObservationObservation”框中框中键入了键入了“3131”,因此在,因此在SPSSSPSS数据编辑窗口中数据编辑窗口中就新增了就新增了fit_1fit_1,fit_2fit_2,fit_3fit_3和和fit_4fit_4等等4 4个个变量的预测值,同时在窗口下方还新增了两变量的预测值,同
50、时在窗口下方还新增了两个个案,它们分别代表对个个案,它们分别代表对20072007年和年和20082008年的年的预测值。如图预测值。如图7-227-22所示。所示。第120页/共187页第121页/共187页7.7 7.7 含虚拟自变量的回归分析含虚拟自变量的回归分析 定义:前面几节所讨论的回归模型中,定义:前面几节所讨论的回归模型中,因变量和自变量都是可以直接用数字计量的,因变量和自变量都是可以直接用数字计量的,即可以获得其实际观测值(如收入、支出、即可以获得其实际观测值(如收入、支出、产量、国内生产总值等),这类变量称作数产量、国内生产总值等),这类变量称作数量变量、定量变量或数量因素。