《统计学实验方差回归分析精选PPT.ppt》由会员分享,可在线阅读,更多相关《统计学实验方差回归分析精选PPT.ppt(68页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、SPSSSPSS关于统计学实验方差回归分析1第1页,讲稿共68张,创作于星期二SPSSSPSS2方差分析方差分析(Analysis of Variance,ANOVA)1928年由英国统计学家年由英国统计学家R.A.Fisher 首先提出,首先提出,为纪念为纪念Fisher,以,以F 命名,故方差分析又称为命名,故方差分析又称为 F检验检验。第2页,讲稿共68张,创作于星期二SPSSSPSS3方差分析方差分析(ANOVA)检验多个总体均值是否相等检验多个总体均值是否相等研究研究一个或多个一个或多个分类型自变量分类型自变量对对一个一个数值型因变量的影数值型因变量的影响响 有单因素方差分析和双因素
2、方差分析有单因素方差分析和双因素方差分析单因素方差分析:涉及一个分类的自变量单因素方差分析:涉及一个分类的自变量双因素方差分析:涉及两个分类的自变量双因素方差分析:涉及两个分类的自变量无交互作用的双因素方差分析;无交互作用的双因素方差分析;有交互作用的双因素方差分析;有交互作用的双因素方差分析;第3页,讲稿共68张,创作于星期二SPSSSPSS4 方差分析检验假定方差分析检验假定 总体是服从正态分布的;总体是服从正态分布的;总体方差是相等的;总体方差是相等的;随机样本是独立的。随机样本是独立的。第4页,讲稿共68张,创作于星期二单因素方差分析单因素方差分析用于检验由单一因素影响的一个用于检验由
3、单一因素影响的一个(或几个相或几个相互独立的互独立的)因变量按因素各水平分组的均值之间因变量按因素各水平分组的均值之间是否具有显著性差异,也可用于进行两两组间是否具有显著性差异,也可用于进行两两组间均值的比较;均值的比较;可通过可通过One-Way ANOVAOne-Way ANOVA对话框实现。对话框实现。第5页,讲稿共68张,创作于星期二SPSSSPSS6建立的假设组为:建立的假设组为:提出假设提出假设H0:1 2 k 自变量对因变量没有显著影响,没有系统误差自变量对因变量没有显著影响,没有系统误差 H1:1,2,,k 不全相等不全相等自变量对因变量有显著影响自变量对因变量有显著影响 注注
4、意意:拒拒绝绝原原假假设设,只只表表明明至至少少有有两两个个总总体体的的均均值值不不相相等等,并不意味着所有的均值都不相等并不意味着所有的均值都不相等 第6页,讲稿共68张,创作于星期二例例1单因素方差分析单因素方差分析某企业需要一种零件,现有三个不同的地区的企业生产的同种零某企业需要一种零件,现有三个不同的地区的企业生产的同种零件可供选择,为了比较这三个零件的强度是否相同,每个地区的件可供选择,为了比较这三个零件的强度是否相同,每个地区的企业抽出企业抽出6 6件产品进行强度测试,其值如表所示。假设每个企业零件件产品进行强度测试,其值如表所示。假设每个企业零件的强度值服从正态分布,试检验这三个
5、地区企业的零件强度是否存的强度值服从正态分布,试检验这三个地区企业的零件强度是否存在显著差异。在显著差异。地地区区强强度度样样本本12311161108929810385310011899411510673583107976105116102第7页,讲稿共68张,创作于星期二SPSSSPSS81、单击、单击分析分析(Analyze)比较均值(比较均值(Compare Means)单因素单因素(One-Way ANOVA),打开对话框。,打开对话框。步骤:步骤:2、从左框中选择、从左框中选择因变量因变量”零件强度零件强度”进入进入因变量因变量框内,框内,选择选择“地区地区”进入进入因子因子框内。
6、框内。点击确定。点击确定。第8页,讲稿共68张,创作于星期二SPSSSPSS9可以得到方差分析表可以得到方差分析表 u由于由于F统计量值的统计量值的P值明显小于显著性水平值明显小于显著性水平0.05,故拒绝假设,故拒绝假设H0,认为这三个地区的零,认为这三个地区的零件强度有显著差异。件强度有显著差异。u如果需要对各地区间的零件强度进行进一步的比较和分析,可以通过按纽如果需要对各地区间的零件强度进行进一步的比较和分析,可以通过按纽选选项项Option选项,选项,contrast对比对比,Post Hoc两两比较两两比较去实现。去实现。F F 分布分布分布分布F F (k k-1,-1,n n-k
7、 k)0 0拒绝拒绝拒绝拒绝HH0 0不能拒绝不能拒绝不能拒绝不能拒绝H H H H0 0 0 0F F第9页,讲稿共68张,创作于星期二SPSSSPSS103、单击、单击选项选项Option按纽,打开对话框如图所示,选择按纽,打开对话框如图所示,选择输出项。主要有不同水平下样本方差的齐性检验,缺输出项。主要有不同水平下样本方差的齐性检验,缺失值的处理方式及均值的图形。失值的处理方式及均值的图形。本例中选择本例中选择描述性(描述性(Descriptive)进行基本进行基本统计描述,以及统计描述,以及方差同质检验(方差同质检验(Homogeneity of variance test)进行不同水
8、平间方差齐性进行不同水平间方差齐性的检验。的检验。在在缺失值(缺失值(Missing Value)栏中选择系栏中选择系统默认项。统默认项。第10页,讲稿共68张,创作于星期二SPSSSPSS11完成所有选择后返回主对话框,然后单击完成所有选择后返回主对话框,然后单击OK,就可以得到,就可以得到三个地区零件强度分析表。三个地区零件强度分析表。基本统计描述基本统计描述 方差齐性检验方差齐性检验 P值大于值大于0.05,所以因素,所以因素变量的各水平间的方差变量的各水平间的方差是没有显著差异的。是没有显著差异的。Levene检验是一种非参数检验方法,检验是一种非参数检验方法,与与F检验类似,但不依赖
9、与正态性检验类似,但不依赖与正态性假设,比假设,比F检验更稳健。检验更稳健。第11页,讲稿共68张,创作于星期二SPSSSPSS124、如果需要将水平间两两比较,可以单击、如果需要将水平间两两比较,可以单击两两比较两两比较Post Hoc 按纽,打开多重比较对话框。如图所示:按纽,打开多重比较对话框。如图所示:如果满足在水平间方差相等的条件,常用如果满足在水平间方差相等的条件,常用LSD(最小显著性差异法),用(最小显著性差异法),用 t 检验检验完成各组均值间的配对比较。完成各组均值间的配对比较。当方差不等的情况下,可以选择当方差不等的情况下,可以选择Tamhane s T2,用用t检验进行
10、各组均值间的配对比较。检验进行各组均值间的配对比较。第12页,讲稿共68张,创作于星期二SPSSSPSS13选择多重比较方式后,点击选择多重比较方式后,点击OK,得到输出结果。,得到输出结果。从表中可以看出,地区从表中可以看出,地区2与地区与地区3之间的差异是非常显著的,它之间的差异是非常显著的,它们均值差的检验的尾概率为们均值差的检验的尾概率为0.005,明显小于显著性水平,明显小于显著性水平0.05。第13页,讲稿共68张,创作于星期二SPSSSPSS14某大型连锁超市为了解不同促销手段对商品销售额的影响,在其某大型连锁超市为了解不同促销手段对商品销售额的影响,在其某大型连锁超市为了解不同
11、促销手段对商品销售额的影响,在其某大型连锁超市为了解不同促销手段对商品销售额的影响,在其下属五个分店中,对同一类日常生活用品分别采用不同促销方式下属五个分店中,对同一类日常生活用品分别采用不同促销方式下属五个分店中,对同一类日常生活用品分别采用不同促销方式下属五个分店中,对同一类日常生活用品分别采用不同促销方式进行了为期四个月的销售对比试验(进行了为期四个月的销售对比试验(进行了为期四个月的销售对比试验(进行了为期四个月的销售对比试验(销售对比试验结果见所附数销售对比试验结果见所附数销售对比试验结果见所附数销售对比试验结果见所附数据集据集据集据集SY-22SY-22)。试利用方差分析方法,检验
12、不同促销方式下的商品。试利用方差分析方法,检验不同促销方式下的商品。试利用方差分析方法,检验不同促销方式下的商品。试利用方差分析方法,检验不同促销方式下的商品销售量是否存在显著性差异销售量是否存在显著性差异销售量是否存在显著性差异销售量是否存在显著性差异(试验前该类商品在五个分店内的月销(试验前该类商品在五个分店内的月销(试验前该类商品在五个分店内的月销(试验前该类商品在五个分店内的月销售额基本处于同一水平)。售额基本处于同一水平)。售额基本处于同一水平)。售额基本处于同一水平)。例例2分析思路:分析思路:分析思路:分析思路:uu这是单一因素影响下的方差分析问题,可以以月销售额为因变量,这是单
13、一因素影响下的方差分析问题,可以以月销售额为因变量,这是单一因素影响下的方差分析问题,可以以月销售额为因变量,这是单一因素影响下的方差分析问题,可以以月销售额为因变量,以促销方式为影响因素变量进行分析;以促销方式为影响因素变量进行分析;以促销方式为影响因素变量进行分析;以促销方式为影响因素变量进行分析;uu分析过程利用分析过程利用分析过程利用分析过程利用SPSSSPSS软件中的软件中的软件中的软件中的One-Way ANOVAOne-Way ANOVA菜单实现。菜单实现。菜单实现。菜单实现。第14页,讲稿共68张,创作于星期二SPSSSPSS15操作步骤:操作步骤:操作步骤:操作步骤:uu打开
14、数据集打开数据集打开数据集打开数据集SYSY-22-22,变量,变量,变量,变量SALESALE和和和和A A分别表示月销售额和促销方分别表示月销售额和促销方分别表示月销售额和促销方分别表示月销售额和促销方式式式式。uu依次选择依次选择依次选择依次选择Analyze Compare Means One-Way ANOVAAnalyze Compare Means One-Way ANOVA,展开单,展开单,展开单,展开单因素方差分析对话框,将变量因素方差分析对话框,将变量因素方差分析对话框,将变量因素方差分析对话框,将变量SALESALE送入送入送入送入Dependent listDepend
15、ent list框,将影框,将影框,将影框,将影响因素变量响因素变量响因素变量响因素变量A A送入送入送入送入FactorFactor框。框。框。框。uu单击单击单击单击Post HocPost Hoc项,在打开的对话框中,选中项,在打开的对话框中,选中项,在打开的对话框中,选中项,在打开的对话框中,选中LSDLSD复选框,以进行复选框,以进行复选框,以进行复选框,以进行各组均值间的两两比较。继续单击各组均值间的两两比较。继续单击各组均值间的两两比较。继续单击各组均值间的两两比较。继续单击ContinueContinue按钮,返回到主对话按钮,返回到主对话按钮,返回到主对话按钮,返回到主对话框
16、。框。框。框。uu单击单击单击单击OKOK按钮,即得出单因素方差分析的运行结果按钮,即得出单因素方差分析的运行结果按钮,即得出单因素方差分析的运行结果按钮,即得出单因素方差分析的运行结果。第15页,讲稿共68张,创作于星期二SPSSSPSS16单因素方差分析的输出结果单因素方差分析的输出结果输输输输出出出出结结结结果果果果第16页,讲稿共68张,创作于星期二SPSSSPSS17双因素方差分析双因素方差分析双因素方差分析的应用范围很广;双因素方差分析的应用范围很广;双因素方差分析的应用范围很广;双因素方差分析的应用范围很广;应用条件:应用条件:应用条件:应用条件:因变量是数值型变量,且来自或近似
17、来自正态总体。因变量是数值型变量,且来自或近似来自正态总体。因变量是数值型变量,且来自或近似来自正态总体。因变量是数值型变量,且来自或近似来自正态总体。自变量是分类变量,变量可以是数值型或字符型的。自变量是分类变量,变量可以是数值型或字符型的。自变量是分类变量,变量可以是数值型或字符型的。自变量是分类变量,变量可以是数值型或字符型的。各各各各水水水水平平平平下下下下的的的的总总总总体体体体假假假假设设设设服服服服从从从从正正正正态态态态分分分分布布布布,而而而而且且且且假假假假设设设设各各各各水水水水平平平平下下下下的的的的方方方方差是相等的。差是相等的。差是相等的。差是相等的。第17页,讲稿
18、共68张,创作于星期二SPSSSPSS18双因素方差分析双因素方差分析双因素方差分析过程:双因素方差分析过程:双因素方差分析过程:双因素方差分析过程:可以分析出每一个因素的作用;可以分析出每一个因素的作用;各因素之间的交互作用;各因素之间的交互作用;各因素之间的交互作用;各因素之间的交互作用;检验各总体间方差是否相等;检验各总体间方差是否相等;检验各总体间方差是否相等;检验各总体间方差是否相等;能够对因素的各水平间均值差异进行比较等。能够对因素的各水平间均值差异进行比较等。能够对因素的各水平间均值差异进行比较等。能够对因素的各水平间均值差异进行比较等。第18页,讲稿共68张,创作于星期二SPS
19、SSPSS19例例3双因素方差分析双因素方差分析下表是某商品下表是某商品S在不同地区和不同时期的销售量(千件)在不同地区和不同时期的销售量(千件)表。已知数据服从正态分布,则要检验地区因素及时表。已知数据服从正态分布,则要检验地区因素及时间因素对销售量的影响是否显著。(间因素对销售量的影响是否显著。(SY-23)地地区区时时期期1234516.514.213.42.46.221.87.19.41.54.833.610.87.21.74.943.78.98.62.34.657.612.67.52.85.2由于销售量受地区和时间两个因素的影响,这是一个双因素方由于销售量受地区和时间两个因素的影响,
20、这是一个双因素方差分析的问题。差分析的问题。第19页,讲稿共68张,创作于星期二SPSSSPSS201、单击、单击分析分析(Analyze)一般线性模型(一般线性模型(General linear Model)单变量(单变量(Univariate),打开主对话框。,打开主对话框。步骤:步骤:2、从左框中选择因、从左框中选择因变量变量“销售量销售量”进进入入因变量因变量框内,选框内,选择择“地区地区”和和“时期时期”进入进入固定因固定因子子框内。框内。点击确定。点击确定。第20页,讲稿共68张,创作于星期二SPSSSPSS213、单击、单击模型(模型(Model)按纽选择分析模型,得到对话框如图
21、。按纽选择分析模型,得到对话框如图。全因子全因子选项为系统默认项,选项为系统默认项,建立全模型,全模型中包建立全模型,全模型中包括因素之间的交互作用。括因素之间的交互作用。如果选择分析两个因素的交如果选择分析两个因素的交互作用,则必须在每种水平组互作用,则必须在每种水平组合下,取得两个以上的实验数合下,取得两个以上的实验数据,才能实现两个因素的交互据,才能实现两个因素的交互作用的分析结果。作用的分析结果。如果不考虑因素间的交如果不考虑因素间的交互作用时,应当选择互作用时,应当选择设定设定模型。模型。第21页,讲稿共68张,创作于星期二SPSSSPSS22先从左边框中选择因素变先从左边框中选择因
22、素变量进入量进入模型模型框中,然后选框中,然后选择类型。择类型。一般不考虑交互作用时,选一般不考虑交互作用时,选择择主效应主效应,考虑交互作用时,考虑交互作用时,选择选择交互交互。本例中选择主效。本例中选择主效应。应。平方和一般选取默认项平方和一般选取默认项类型类型。单击单击继续继续,返回主对话,返回主对话框,点击框,点击确定确定就可以得到就可以得到相应的双因素方差分析表相应的双因素方差分析表.第22页,讲稿共68张,创作于星期二SPSSSPSS23从表中数据可以看出,从表中数据可以看出,F值对应概率值对应概率P值都小于显著性水平值都小于显著性水平0.05,这说明,这说明地区和时期对销售量的影
23、响都是显著的。地区和时期对销售量的影响都是显著的。第23页,讲稿共68张,创作于星期二SPSSSPSS24实验实验4:相关与回归分析:相关与回归分析相关分析相关分析回归分析回归分析第24页,讲稿共68张,创作于星期二SPSSSPSS25相关分析相关分析相关分析相关分析相关分析相关分析是研究变量间密切程度的统计方法,线性相关是研究变量间密切程度的统计方法,线性相关是研究变量间密切程度的统计方法,线性相关是研究变量间密切程度的统计方法,线性相关分析研究的是两变量间线性关系的程度,用相关系数表示;分析研究的是两变量间线性关系的程度,用相关系数表示;分析研究的是两变量间线性关系的程度,用相关系数表示;
24、分析研究的是两变量间线性关系的程度,用相关系数表示;可以通过可以通过可以通过可以通过分析分析分析分析菜单进行菜单进行菜单进行菜单进行相关分析相关分析相关分析相关分析;SPSSSPSS提供的相关分析功能有提供的相关分析功能有提供的相关分析功能有提供的相关分析功能有双变量相关分析双变量相关分析双变量相关分析双变量相关分析(Bivariate)(Bivariate);偏相关分析偏相关分析偏相关分析偏相关分析 (Partial)(Partial);距离相关分析距离相关分析距离相关分析距离相关分析(Distance)(Distance)。第25页,讲稿共68张,创作于星期二SPSSSPSS26双变量相关
25、分析(简单相关分析)双变量相关分析(简单相关分析)两个变量之间的相关关系称简单相关关系。有两种方法两个变量之间的相关关系称简单相关关系。有两种方法可以反映简单相关关系:可以反映简单相关关系:1.通过散点图直观地显示变量之间关系;通过散点图直观地显示变量之间关系;2.通过相关系数准确地反映两变量的关系程度。通过相关系数准确地反映两变量的关系程度。第26页,讲稿共68张,创作于星期二SPSSSPSS27双变量相关分析双变量相关分析散点图散点图例例4数据库数据库数据库数据库SY-31SY-31中的变量中的变量中的变量中的变量X X表示山东省人均国内生产总值,表示山东省人均国内生产总值,表示山东省人均
26、国内生产总值,表示山东省人均国内生产总值,Y Y表示山东省城镇居民的消费额(资料来源:山东省表示山东省城镇居民的消费额(资料来源:山东省表示山东省城镇居民的消费额(资料来源:山东省表示山东省城镇居民的消费额(资料来源:山东省20032003年统计年鉴),现画出散点图来观察两个变量的年统计年鉴),现画出散点图来观察两个变量的年统计年鉴),现画出散点图来观察两个变量的年统计年鉴),现画出散点图来观察两个变量的关联程度。具体操作步骤如下:关联程度。具体操作步骤如下:关联程度。具体操作步骤如下:关联程度。具体操作步骤如下:1.首先打开数据首先打开数据SY-31;2.然后单击然后单击图形图形Graphs
27、 散点散点Scatter,打开打开散点图散点图Scatter plot对话对话框,选择需要的散点图,图中的框,选择需要的散点图,图中的5个选项如下:个选项如下:第27页,讲稿共68张,创作于星期二SPSSSPSS283.如果只考虑两个变量,可选择如果只考虑两个变量,可选择简单的散点图简单的散点图Simple,然后点击,然后点击定义定义Define,打开,打开简单散点图简单散点图Simple Scatterplot对话框对话框,如左图所如左图所示。示。4.选择变量分别进入选择变量分别进入X轴和轴和Y轴,点击轴,点击OK后就可以得到右边的后就可以得到右边的散点图散点图。第28页,讲稿共68张,创作
28、于星期二SPSSSPSS29双变量相关分析双变量相关分析相关系数相关系数具体操作如下:具体操作如下:1.打开数据库打开数据库SY-31后,单击后,单击分析分析Analyze 相关相关Correlate双变量双变量 Bivariate;如;如图所示。图所示。第29页,讲稿共68张,创作于星期二SPSSSPSS30用于计算分类变用于计算分类变用于计算分类变用于计算分类变量的秩相关,考量的秩相关,考量的秩相关,考量的秩相关,考虑结点的影响虑结点的影响虑结点的影响虑结点的影响用于计算分类用于计算分类用于计算分类用于计算分类变量的秩相关变量的秩相关变量的秩相关变量的秩相关适用于正适用于正适用于正适用于正
29、态分布等态分布等态分布等态分布等间隔测度间隔测度间隔测度间隔测度的变量的变量的变量的变量分析变量分析变量分析变量分析变量2、从左边的变量框中选择需要考察的两个变量进入、从左边的变量框中选择需要考察的两个变量进入 变量框内变量框内,选择相关系数的种,选择相关系数的种类,选择检验方式,单击类,选择检验方式,单击选项选项Options按纽。按纽。第30页,讲稿共68张,创作于星期二SPSSSPSS313.选择输出项和缺失值的处理方式。本例中选择输出基本统计描选择输出项和缺失值的处理方式。本例中选择输出基本统计描述。述。成对剔除带有缺失值的观测量成对剔除带有缺失值的观测量成对剔除带有缺失值的观测量成对
30、剔除带有缺失值的观测量剔除所有带有缺失值的观测量剔除所有带有缺失值的观测量剔除所有带有缺失值的观测量剔除所有带有缺失值的观测量第31页,讲稿共68张,创作于星期二SPSSSPSS324.单击单击OK,可以得到相关分析的结果。见图所示。,可以得到相关分析的结果。见图所示。从表中可以看到两个变量相关性分析的结果:相关系数是从表中可以看到两个变量相关性分析的结果:相关系数是0.996,相关程度非常高,且,相关程度非常高,且假设检验的假设检验的P值远远地小于值远远地小于0.05,可以认为人均国内生产总值与城镇居民消费额存,可以认为人均国内生产总值与城镇居民消费额存在线性正相关关系。在线性正相关关系。第
31、32页,讲稿共68张,创作于星期二SPSSSPSS33偏相关分析偏相关分析 简单相关关系只反映两个变量之间的关系,但如果因变简单相关关系只反映两个变量之间的关系,但如果因变量受到多个因素的影响时,因变量与某一自变量之间的简量受到多个因素的影响时,因变量与某一自变量之间的简单相关关系显然受到其它相关因素的影响,不能真实地反单相关关系显然受到其它相关因素的影响,不能真实地反映二者之间的关系,所以需要考察在其它因素的影响剔除映二者之间的关系,所以需要考察在其它因素的影响剔除后二者之间的相关程度,即偏相关分析。后二者之间的相关程度,即偏相关分析。第33页,讲稿共68张,创作于星期二SPSSSPSS34
32、例例5为了考察火柴销售量的影响因素,选择煤气户数、卷烟为了考察火柴销售量的影响因素,选择煤气户数、卷烟为了考察火柴销售量的影响因素,选择煤气户数、卷烟为了考察火柴销售量的影响因素,选择煤气户数、卷烟销量、蚊香销量、打火石销量作为影响因素,得数据表。销量、蚊香销量、打火石销量作为影响因素,得数据表。销量、蚊香销量、打火石销量作为影响因素,得数据表。销量、蚊香销量、打火石销量作为影响因素,得数据表。试求火柴销售量与煤气户数的偏相关系数试求火柴销售量与煤气户数的偏相关系数试求火柴销售量与煤气户数的偏相关系数试求火柴销售量与煤气户数的偏相关系数.年份年份火柴销售量火柴销售量(万件)(万件)煤气户数煤气
33、户数(万户)(万户)卷烟销量卷烟销量(百箱)(百箱)蚊香销量蚊香销量(十万盒)(十万盒)打火石销量打火石销量(百万粒)(百万粒)6823.6925.6823.610.14.186924.125.7723.4213.312.437022.7425.8822.099.496.57117.8427.4321.4311.0925.787218.2729.9524.9614.4828.167320.2933.5328.3716.9724.267422.6137.3142.5720.1630.187526.7141.1645.1626.3917.087631.1945.7352.4627.047.3977
34、30.550.5945.323.083.887829.6358.8246.824.4610.537929.6965.2851.1133.8220.098029.2571.2553.2933.5721.228131.0573.3755.3639.5912.638232.2876.685448.4911.17第34页,讲稿共68张,创作于星期二SPSSSPSS35求解火柴销售量与煤气户数的偏相关系数具体操作如下:求解火柴销售量与煤气户数的偏相关系数具体操作如下:1、首先打开数据文件、首先打开数据文件SY-32,单击分析,单击分析Analyze 相关相关 Correlate偏相关偏相关 Partia
35、l,打开对话框,见图所示。,打开对话框,见图所示。要考察的变量要考察的变量要考察的变量要考察的变量 其它客观存在的变量其它客观存在的变量其它客观存在的变量其它客观存在的变量 2、从左边框内选择要考察、从左边框内选择要考察的两个变量进入变量框内,的两个变量进入变量框内,其它变量进入控制框内,如其它变量进入控制框内,如本例中考察煤气户数与火柴本例中考察煤气户数与火柴销量的偏相关系数进入变量销量的偏相关系数进入变量框内,其它(除年份外)进框内,其它(除年份外)进入控制框内。入控制框内。第35页,讲稿共68张,创作于星期二SPSSSPSS36Partial Correlations Partial C
36、orrelations 对话框对话框对话框对话框第36页,讲稿共68张,创作于星期二SPSSSPSS37Partial Correlations Partial Correlations 对话框对话框对话框对话框(即:即:即:即:PearsonPearson相关系数相关系数相关系数相关系数)本例中选择简单相关系数。本例中选择简单相关系数。第37页,讲稿共68张,创作于星期二SPSSSPSS38输出结果:输出结果:从表中可以看出,火柴销量与煤气户数的简单相关系数为从表中可以看出,火柴销量与煤气户数的简单相关系数为0.826,自由度为,自由度为13,检验的,检验的P值为值为0.00;而偏相关系数为
37、;而偏相关系数为0.605,自由度为,自由度为10,检验的,检验的P值值为为0.037,表示煤气户数对火柴销量的真实影响是显著的。,表示煤气户数对火柴销量的真实影响是显著的。表中的上半部分是简单相关系数表中的上半部分是简单相关系数,下半部分是偏相关系数。,下半部分是偏相关系数。第38页,讲稿共68张,创作于星期二SPSSSPSS39回归分析回归分析回归分析回归分析研究的是自变量与因变量之间的非确定性的因研究的是自变量与因变量之间的非确定性的因研究的是自变量与因变量之间的非确定性的因研究的是自变量与因变量之间的非确定性的因果关系;果关系;果关系;果关系;SPSSSPSSSPSSSPSS提供的回归
38、分析过程有:提供的回归分析过程有:提供的回归分析过程有:提供的回归分析过程有:线性回归线性回归线性回归线性回归(Linear)(Linear)(Linear)(Linear)、曲线估计曲线估计曲线估计曲线估计(Curve Estimation)(Curve Estimation)(Curve Estimation)(Curve Estimation)、二分变量逻辑回归二分变量逻辑回归二分变量逻辑回归二分变量逻辑回归 (Binary Logistic)(Binary Logistic)(Binary Logistic)(Binary Logistic)、多分变量逻辑回归、多分变量逻辑回归、多分变
39、量逻辑回归、多分变量逻辑回归(Multinomial Logistic)(Multinomial Logistic)(Multinomial Logistic)(Multinomial Logistic)、序回归、序回归、序回归、序回归(Ordinal)(Ordinal)(Ordinal)(Ordinal)、概率单位回归、概率单位回归、概率单位回归、概率单位回归(Probit)(Probit)(Probit)(Probit)、非线性回归、非线性回归、非线性回归、非线性回归(Nonlinear)(Nonlinear)(Nonlinear)(Nonlinear)、加权估计、加权估计、加权估计、加权
40、估计(Weight Estimation)(Weight Estimation)(Weight Estimation)(Weight Estimation)、最优编码回归、最优编码回归、最优编码回归、最优编码回归(optimal Scaling)(optimal Scaling)(optimal Scaling)(optimal Scaling)和二阶段最小平方和二阶段最小平方和二阶段最小平方和二阶段最小平方法法法法(2-Stage Least Squares)(2-Stage Least Squares)(2-Stage Least Squares)(2-Stage Least Square
41、s)。回归分析回归分析第39页,讲稿共68张,创作于星期二SPSSSPSS40线性回归分析线性回归分析线性回归是统计分析方法中最常用的方法之一。如果所研线性回归是统计分析方法中最常用的方法之一。如果所研究的现象有若干个影响因素,且这些因素对现象的综合影响究的现象有若干个影响因素,且这些因素对现象的综合影响是线性的,则可以使用线性回归的方法建立现象是线性的,则可以使用线性回归的方法建立现象(因变量)(因变量)与影响因素(自变量)之间的线性函数关系式。由于多元线与影响因素(自变量)之间的线性函数关系式。由于多元线性回归的计算量比较大,所以有必要应用统计分析软件实现。性回归的计算量比较大,所以有必要
42、应用统计分析软件实现。介绍介绍SPSS软件的线性回归分析的操作方法,包括求回归系数,软件的线性回归分析的操作方法,包括求回归系数,给出回归模型的各项检验统计量值及相应的概率,对输出结给出回归模型的各项检验统计量值及相应的概率,对输出结果的分析等相关内容。果的分析等相关内容。第40页,讲稿共68张,创作于星期二SPSSSPSS411、线性回归的假设理论、线性回归的假设理论(1)正态性假设:即所研究的变量均服从正态分布;)正态性假设:即所研究的变量均服从正态分布;(2)等方差假设:即各变量总体的方差是相等的;)等方差假设:即各变量总体的方差是相等的;(3)独立性假设)独立性假设,即各变量之间是相互
43、独立的;即各变量之间是相互独立的;(4)残差项无自相关性,即误差项之间互不相关)残差项无自相关性,即误差项之间互不相关;2、线性回归模型的检验项目、线性回归模型的检验项目(1)回归系数的检验()回归系数的检验(t检验)。检验)。(2)回归方程的检验()回归方程的检验(F检验)。检验)。(3)拟合程度判定(可决系数)拟合程度判定(可决系数R2)。)。(4)D.W检验(残差项是否自相关)。检验(残差项是否自相关)。(5)共线性检验(多元线性回归)。)共线性检验(多元线性回归)。(6)残差图示分析(判断异方差性和残差序列自相关)。)残差图示分析(判断异方差性和残差序列自相关)。线性回归模型假设条件与
44、模型的各种检验线性回归模型假设条件与模型的各种检验第41页,讲稿共68张,创作于星期二SPSSSPSS421、打开数据文件,单击、打开数据文件,单击分析分析Analyze 回归回归Regression 线性线性Linear,打开对话框如图所示。打开对话框如图所示。指定回归方法指定回归方法指定回归方法指定回归方法全部选入全部选入全部选入全部选入逐步回归逐步回归逐步回归逐步回归强行剔除强行剔除强行剔除强行剔除向后剔除向后剔除向后剔除向后剔除向前选择向前选择向前选择向前选择加权最小平方法加权最小平方法加权最小平方法加权最小平方法指定选择参与回归指定选择参与回归指定选择参与回归指定选择参与回归分析观测
45、量的变量分析观测量的变量分析观测量的变量分析观测量的变量指定作为观测指定作为观测指定作为观测指定作为观测量标签的变量量标签的变量量标签的变量量标签的变量线性回归分析的具体步骤:线性回归分析的具体步骤:2、从左边框中选、从左边框中选择因变量择因变量Y,选择一,选择一个或多个自变量。从个或多个自变量。从方法方法 框内下拉式菜单框内下拉式菜单中选择回归分析方法。中选择回归分析方法。第42页,讲稿共68张,创作于星期二SPSSSPSS433.单击单击统计量统计量Statistics,打开,打开线性回归:统计量线性回归:统计量对话框,可以对话框,可以选择输出的统计量如图所示。选择输出的统计量如图所示。德
46、宾德宾德宾德宾-沃森检验沃森检验沃森检验沃森检验提供判定系数、提供判定系数、提供判定系数、提供判定系数、估计标准误、估计标准误、估计标准误、估计标准误、ANOVAANOVA表等表等表等表等显示每个自变量显示每个自变量显示每个自变量显示每个自变量进入方程后对进入方程后对进入方程后对进入方程后对R R2 2和和和和F F值的影响值的影响值的影响值的影响观测值诊断观测值诊断观测值诊断观测值诊断估计(系统默认估计(系统默认):包括回归系数,包括回归系数,回归系数标准误、标准化回归系回归系数标准误、标准化回归系数、回归系数检验统计量(数、回归系数检验统计量(t值)值)及相应的检验统计量概率的及相应的检验
47、统计量概率的P值(值(sig)。)。描述性统计量描述性统计量描述性统计量描述性统计量第43页,讲稿共68张,创作于星期二SPSSSPSS444、如果需要观察图形,可单击、如果需要观察图形,可单击绘制绘制Plots按纽,打开按纽,打开线性回线性回归:图归:图对话框,如图所示。在此对话框中可以选择所需要的对话框,如图所示。在此对话框中可以选择所需要的图形。图形。标准化预测值标准化预测值标准化预测值标准化预测值标准化残差标准化残差标准化残差标准化残差剔除残差剔除残差剔除残差剔除残差调整预测值调整预测值调整预测值调整预测值学生化残差学生化残差学生化残差学生化残差学生化剔除残差学生化剔除残差学生化剔除残
48、差学生化剔除残差输出标准化残差相对于因变输出标准化残差相对于因变输出标准化残差相对于因变输出标准化残差相对于因变量的散布图量的散布图量的散布图量的散布图在左上角的源变量框中,在左上角的源变量框中,选择选择Dependent 进入进入X(或(或Y)轴变量框,选择其它变量进)轴变量框,选择其它变量进入入Y(或(或X)轴变量框,除因变)轴变量框,除因变量外,其客观存在变量依次是:量外,其客观存在变量依次是:ZPRED:标准化预测值,标准化预测值,ZRESID:标准化残差,标准化残差,DRESID:剔除残差,剔除残差,ADJPRED:修正后预测值,修正后预测值,SRESID学生化残差,学生化残差,SD
49、RESID:学生化剔除残差。学生化剔除残差。第44页,讲稿共68张,创作于星期二SPSSSPSS455、单击、单击选项选项Options按纽,打开线性回归:选项对话框,如图所按纽,打开线性回归:选项对话框,如图所示。可以从中选择模型拟合判断准则及缺失值的处理方式。示。可以从中选择模型拟合判断准则及缺失值的处理方式。l步行方法标准(步行方法标准(Stepping Method Criteria)栏,设置变量引入或剔除模型的判别标)栏,设置变量引入或剔除模型的判别标准。准。l使用使用F的概率(的概率(Use probability of F):采用采用F检验的概率为判别依据。检验的概率为判别依据。
50、l使用使用F值(值(Use F value):采用采用F值作为检验值作为检验标准。标准。lInclude constant in equation 回归方程中包括回归方程中包括常数项。常数项。l缺失值(缺失值(Missing Values):):缺失值的处理缺失值的处理方式。方式。第45页,讲稿共68张,创作于星期二SPSSSPSS466、如果要保存预测值等数据,可单击、如果要保存预测值等数据,可单击保存(保存(Save)按纽打开按纽打开对话框。对话框。选择需要保存的数据种类作选择需要保存的数据种类作为新变量存在数据编辑窗口。为新变量存在数据编辑窗口。其中有预测值、残差,预测其中有预测值、残差