《spss09回归分析(1).ppt》由会员分享,可在线阅读,更多相关《spss09回归分析(1).ppt(158页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、 第9章 回 归 分 析 Regression目目 录录 线 性 回 归 曲 线 估 计 二项逻辑斯谛回归 多分变量的逻辑斯谛回归 概率单位回归 非线性回归 加 权 回 归 两段最小二乘法 最优尺度回归 习题参考答案线 性 回 归 返回一元线性回归有关公式一元线性回归有关公式 对斜率检验的假设是,总体回归系数对斜率检验的假设是,总体回归系数b=0。检验该假设的。检验该假设的t值计算公式是:值计算公式是:对截距检验的假设是,总体回归方程截距对截距检验的假设是,总体回归方程截距a=0。检验该假设的。检验该假设的t值计算公式是:值计算公式是:在两公式中,在两公式中,SEb是回归系数的标准误。是回归系
2、数的标准误。SEa是截距的标准误。是截距的标准误。一元线性回归有关公式一元线性回归有关公式 R R2 2判定系数判定系数 方差分析方差分析 (a)(b)(c)(d)(e)(f)(g)一元线性回归一元线性回归各种残差与预测值关系示意图各种残差与预测值关系示意图 返回多元线性回归的概念多元线性回归的概念多元回归分析的模型多元回归分析的模型 校正校正R R2 2判定系数的公式判定系数的公式 其中其中k k为自变量的个数,为自变量的个数,n n为观测量数目为观测量数目 偏回归系数和常数项的偏回归系数和常数项的t t检验的公式检验的公式 变非线性关系为线性关系变非线性关系为线性关系+转换方法转换方法使用
3、条件使用条件注注 释释Var(Var(e ei i)E()E(y yi i)因变量服从泊松分布因变量服从泊松分布 +Var(Var(e ei i)E()E(y yi i)某些因变量的值为某些因变量的值为0 0,或者很小,或者很小变量转换公式表变量转换公式表 Log Log y yVar(Var(e ei i)E()E(y yi i)2 2,y y00因变量的值的范围很大因变量的值的范围很大Log(Log(y y+1)+1)Var(Var(e ei i)E()E(y yi i)2 2因变量的某些值为因变量的某些值为0 01/1/y yVar(Var(e ei i)E()E(y yi i)4 4因
4、变量的值集中在因变量的值集中在0 0的附近,当自变量明显的附近,当自变量明显降低时,因变量出现较大的值。例如:自降低时,因变量出现较大的值。例如:自变量是治疗某病的药剂量,因变量是反应变量是治疗某病的药剂量,因变量是反应时间。时间。1/(1/(y y+1)+1)Var(Var(e ei i)E()E(y yi i)4 4某些自变量为某些自变量为0 0的情况的情况Var(Var(e ei i)E()E(y yi i)(1)(1(y yi i)用于二项比例用于二项比例(0(0因变量因变量1)1)变非线性关系为线性关系变非线性关系为线性关系转换为线性的常用方法转换为线性的常用方法 变变 化化 方方
5、法法回回 归归 式式loglogy yloglogx xy y=aaloglogy yx xy y=aeaexxy yloglogx xy y=a a+loglogx x1/1/y y1/1/x xy y=x x/(/(axax+)1/1/y yx xy y=1/(=1/(a a+xx)y y1/1/x xy y=a a+(1/(1/x x)回归菜单回归菜单线性回归主对话框线性回归主对话框 返回设定运算规则对话框设定运算规则对话框 返回输出统计量对话框输出统计量对话框 返回选择图形对话框选择图形对话框 返回保存变量对话框保存变量对话框 返回选择对话框选择对话框 返回简单散点图对话框图简单散点图
6、对话框图 返回散点图示例散点图示例 返回初始工资与当前工资散点图初始工资与当前工资散点图回归模型的建立(示例输出回归模型的建立(示例输出1)返回引入或从模型中剔除的变量引入或从模型中剔除的变量回归模型的建立(示例输出回归模型的建立(示例输出2)返回拟合过程小结拟合过程小结回归模型的建立(示例输出回归模型的建立(示例输出3)返回方差分析方差分析回归模型的建立(示例输出回归模型的建立(示例输出4)返回逐步回归不在方程中的变量逐步回归不在方程中的变量回归模型的建立(示例输出回归模型的建立(示例输出5)返回建立模型过程中的各模型回归系数及检验结果建立模型过程中的各模型回归系数及检验结果回归模型的建立(
7、示例输出回归模型的建立(示例输出6)返回当前工资变量的异常值表当前工资变量的异常值表回归模型的建立(示例输出回归模型的建立(示例输出7)返回残差分析的统计量残差分析的统计量回归模型的建立(示例输出回归模型的建立(示例输出8)返回判定影响点的统计量判定影响点的统计量 返回标准化回归系数的变化量标准化回归系数的变化量回归模型的建立(示例输出回归模型的建立(示例输出9)回归模型的建立(示例输出回归模型的建立(示例输出10)返回共线性诊断共线性诊断当前工资的预测值与其学生式残差散点图当前工资的预测值与其学生式残差散点图 返回曲 线 估 计 返回曲线估计对话框 返回各种曲线回归模型各种曲线回归模型模型名
8、称模型名称回归方程回归方程相应的线性回归方程相应的线性回归方程LinearLineary y=b=b0 0+b+b1 1t tQuadratic Quadratic y y=b=b0 0+b+b1 1t t+b+b2 2t t2 2Compound Compound y y=b=b0 0(b(b1 1 t t)ln(ln(y y)=ln(b)=ln(b0 0)+ln(b)+ln(b1 1)t tGrowth Growth ln(ln(y y)=b)=b0 0+b+b1 1t tLogarithmicLogarithmicy y=b=b0 0+b+b1 1ln(ln(t t)Cubic Cubi
9、c y y=b=b0 0+b+b1 1t t+b+b2 2t t2 2+b+b3 3t t3 3S Sln(ln(y y)=b)=b0 0+b+b1 1/t tExponential Exponential ln(ln(y y)=ln(b)=ln(b0 0)+b)+b1 1t tInverse Inverse y y=b=b0 0+(b+(b1 1/t t)Power Power y y=b=b0 0(t tb1b1)ln(ln(y y)=ln(b)=ln(b0 0)+b)+b1 1ln(ln(t t)Logistic Logistic y y=1/(1/u+b=1/(1/u+b0 0(b(b
10、1 1t t)ln(1/ln(1/y y-1/u)=ln(b1/u)=ln(b0 0+ln(b+ln(b1 1)t t)返回保存对话框保存对话框 返回曲线回归实例散点图曲线回归实例散点图 返回每加仑里程与车重散点图每加仑里程与车重散点图曲线回归实例输出曲线回归实例输出1QuadraticQuadratic模型拟合模型拟合系数及其检验结果系数及其检验结果模型的方差分析结果模型的方差分析结果拟合优度的检验拟合优度的检验二次模型分析结果二次模型分析结果曲线回归实例输出曲线回归实例输出2 返回三次模型分析结果三次模型分析结果CUBIC模型拟合模型拟合系数及其检验结果系数及其检验结果模型的方差分析结果模
11、型的方差分析结果拟合优度的检验拟合优度的检验曲线回归实例输出曲线回归实例输出3 返回 指数模型分析结果指数模型分析结果Compound模型拟合模型拟合系数及其检验结果系数及其检验结果模型的方差分析结果模型的方差分析结果拟合优度的检验拟合优度的检验曲线回归实例输出曲线回归实例输出4 返回三种模型的图形比较三种模型的图形比较二项逻辑斯谛回归二项逻辑斯谛回归 返回有关二项逻辑斯谛回归的公式有关二项逻辑斯谛回归的公式Logistic回归曲线 返回指示变量编码方法 返回背离编码方法 返回二项逻辑斯谛过程对话框 返回设定选择规则对话框 返回定义分类变量对话框 返回保存新变量对话框 返回选择对话框 返回观测
12、量简表 返回 因变量代码表 返回分类变量代码表 返回因变量分类表 返回起始模型统计量表 返回起始模型外的变量 返回起始模型卡方检验表 返回最终模型的拟合优度检验 返回依据预测概率的观测量分组表 返回正态概率分布图与反正态概率图 返回 不同类型的散点图 返回9.4 多分变量的逻辑斯谛回归 返回配对变量之间的差异 返回种族的编码方式 返回逻辑斯谛回归对话框 返回Reference Category对话框 返回SAVE对话框 返回标准对话框 返回模型对话框 返回Statistics对话框 返回模型常用统计量 返回增加变量educ作为协变量(Covariates)后的参数根据统计量 返回加入学历后的统
13、计量表 返回似然比 返回不同选择项的统计量之一 返回不同选择项的统计量之二 返回选举人投给不同候选人选票的情况 返回分类表 返回拟合度统计量 返回9.5 概率单位回归 返回 概率分布函数值 返回概率单位对话框 返回Option对话框 返回数据基本情况表 返回得出模型参数表 返回deguel、rotenoneg各剂量致死率与95%的置信区间 返回观测与期望频数表 返回各组半数效应比较值 返回散点图 返回9.6 非线性回归 返回常用非线性模型 名 称模 型 表 达 式Asymptotic b1+b2*exp(b3*x)Asymptotic b1(b2*b3x)Density(b1+b2*x)(-1
14、/b3)Gaussb1*(1 b3*exp(-b2*x2)Gompertzb1*exp(b2*exp(b3*x)Johnson-Schumacherb1*exp(-b2/(x+b3)Log-Modified(b1+b3*x)b2Log-Logisticb1 ln(1+b2*exp(b3*x)Metcherlich Law of Diminishing Returnsb1+b2*exp(b3*x)Michaelis Mentenb1*x/(x+b2)Morgan-Mercer-Florin(b1*b2+b3*xb4)/(b2+xb4)Peal-Reedb1/(1+b2*exp(b3*x+b4*x
15、2+b5*x3)Ratio of Cubics(b1+b2*x+b3*x2+b4*x3)/(b5*x3)Ratio of Quadratics(b1+b2*x+b3*x2)/(b4*x2)Richardsb1/(1+b3*exp(b2*x)(1/b4)Verhulstb1/(1+b3*exp(b2*x)Von Bertalanffy(b1(1-b4)-b2*exp(-b3*x)(1/(1-b4)Weibullb1 b2*exp(b3*xb4)Yield Density(b1+b2*x+b3*x2)-1 返回非线性回归主对话框 返回参数设置对话框 返回参数约束对话框 返回损失函数对话框 返回选择
16、对话框 返回保存新变量对话框 返回美国1790年1960年人口数据散点图 返回残差平方和和每一步迭代的参数值 返回非线性模型统计量摘要 返回观测量与预测值的散点图 返回残差对观测年度散点图 返回参数估计的渐近相关矩阵 返回参数估计的渐进相关阵 返回9.7 加加 权权 回回 归归 返回 原始变量散点图与残差图散点图 返回权重估计对话框图 返回权重估计选择项对话框 返回权值列表 返回回归效果的统计量 返回方差分析表 返回模型参数及各种统计量 返回一般线性回归(左)和加权线性回归(右)的统计量 返回一般线性回归(左)和加权回归(右)的统计量:系数 返回转换后的预测值对转换后的残差值图形 返回9.8
17、两段最小二乘法 返回简单经济模型 返回供求关系图 返回模型的一般统计量 返回市场情况 返回内生变量的作用 返回二段最小平方法对话框 返回选择对话框 返回回归分析的统计量 返回方差分析 返回在方程式中的参数 返回参数间的相关系数矩阵 返回9.9 最优尺度回归最优尺度回归 返回最优尺度回归主对话框 返回定义范围和尺度对话框 返回Discretization对话框 返回Missing value对话框 返回Option对话框 返回Output对话框 返回Save对话框 返回Plots对话框 返回数据情况 返回描述性统计量 返回相关系数统计量 返回方差分析表 返回相关系数分析表 返回happiness
18、转换图 返回习题1数据spss11-1101是某企业19871998年的经济效益、科研人员、科研经费的统计数据。假定1999年该企业科研人员61名、科研经费40万元,试预测1999年该企业的经济效益。2.某商场19891998年的商品流通费用率与商品零售额资料如数据spss11-1102所示。若1999年该商场商品零售额36.33亿元,试预测1999年该商场商品流通费用额。3.某地1994年农业方面作出了较大的改革,其数据资料为spss11-1103,试使用虚拟变量的回归方程,并对农民的人均收入变化作出回归分析。4.R.Norell进行了一项利用电流刺激农场动物的实验,其目的是为了了解高压电线
19、对牲畜的影响。以便在对新农场选址时,对高压线的辐射电流进行测试,如果超过一成的牲畜对高压电流有反应时就需要重新选址。返回习题一 数据spss09-10是某企业19871998年的经济效益、科研人员、科研经费的统计数据。假定1999年该企业科研人员61名、科研经费40万元,试预测1999年该企业的经济效益。返回习题一操作步骤1.打开数据spss09-10,按照AnalyzeRegressionLinear顺序,将变量ecobeni(经济效益)选入Dependent框中作为因变量,将变量per(科研人员数量)、fee(科研经费)选入Independent(s)框中作为自变量。2.打开Plots对话
20、框,将变量ZPRED与ZRESID分别选入X、Y框中用来检验残差的分布情况,打开statistics对话框选择Estimates、Model fit、Durbin-Watson统计量;其它选择项为SPSS默认选择项。3.单击OK按钮提交运算。返回第1题参考答案-1 R2检验:得出的R2为0.999,调整后的RSquare为0.998,均很接近1,说明x1、x2与y的关系很密切。DW检验:对于给定的显著性水平为a=0.05,解释变量个数 k=3、样本个数 n=12,查DW检验表。因DW检验表中样本容量n最小为15,故取临界值 d1=0.82,du=1.75,于是有DW统计值在d1=0.82DW=
21、2.621524du=2.25之间。所以该回归模型不存在自相关。返回第1题参考答案-2 F检验:在方差分析中得出的F检验值为1905.789远远大于 F0.05(2,12-2-1)=4.26,说明x1、x2与y之间的回归效果非常显著。返回第1题参考答案-3 t检验:在回归模型区域A16:I19中,给出了回归系数0、1、2的估计值及其标准误差、检验值。由于各回归系数的 检验值分别为t0=12.764,t1=7.547,t2=18.780,都大于=2.2622,故拒绝原假设=0,=0和=0。即可以断言:科研人员与科研经费对该企业的经济效益有显著影响。返回第1题参考答案-4 从下图经济效益预测值与其
22、学生化残差散点图中可以看到绝大部分观测量随机地落在垂直围绕2的范围内,预测值与学生化残差值之间没有明显的关系,所以回归方程应该满足线性与方差齐性的假设且拟合效果较好。综合上述计算结果和检验结果,可得如下的回归模型:y=116.81+4.182x1+26.02x2 1999年该企业科研人员61名、科研经费40万元,其经济效益为116.814.1826126.02401412.7万元。返回第2题参考答案 某商场19891998年的商品流通费用率与商品零售额资料如data09-11所示。若1999年该商场商品零售额36.33亿元,试预测1999年该商场商品流通费用额。返回第2题操作步骤-11.打开d
23、ata09-11数据文件,按照GraphsScatterSimple的顺序打开Scatter对话框,将变量ratio选入Y轴(Y-axis),将变量total选入X轴(X-axis)。2.单击ok按钮提交运算。从图中可以看出,随着商品零售额的增加,商品流通费用率有不断下降的趋势,呈现曲线形状。建立曲线回归模型。返回第2题操作步骤-21.按照按AnalyzeregressionCurve Estimation顺序打开Curve Estimation对话框,将变量total选入indenpent框中作为自变量,将变量ratio选入Dependent框中作为因变量;在models选择项中选择Inve
24、rse、Quadratic、Cubic模型以便进行对比;选择Plot models、Include constant in equation、Display ANOVA table选择项;2.单击Ok按钮提交运算。返回第2题结果分析比较三个模型的R2值见下各表。CUB模型的R2=0.991最大,INV模型次之R2=0.971,QUA模型的R2=0.953最小。由此可以初步判断,拟合最好的是CUB模型。返回第2题结果分析2各种模型曲线。返回第2题结论 由CUB模型Y=b0+b1t+b2t2+b3t3得出方程式为:ratio15.86-1.34tatol+0.05tatol2-0.0007tato
25、l3 初步计算后发现其ratio值为负值,与实际情况不符,选择Inverse.模型:Y=b0+(b1/t),得到Y=2.57+42.76/tatol。将1999年该商场商品零售额36.33亿元代入模型得出ratio2.5742.76/36.33=3.75%,由 此可以得出1999年该商场商品流通费用总额预测值为1.36万元(36.333.75%)。返回第3题参考答案 R.Norell进行了一项利用电流刺激农场动物(实验对象为牛)的实验,其目的是为了了解高压电线对牲畜的影响。建立模型,在对新农场选址时,对高压线的辐射电流进行测试,如果超过一成的牲畜对高压电流有反应时就需要重新选址。Probitd
26、ata数据中变量“current”为刺激电流、变量“experiment”为总的实验次数、变量“anwser”为对电流做出反应的响应次数。返回第3题操作步骤(1)读取数据文件spss09-12。(2)按AnalyzeRegressionProbit顺序打开Probit对话框。(3)选择变量“answer”作为响应变量送入Response Frequency框中;选择变量“experiment”作为总观测变量送入Total observed框中。(4)选择变量“current”变量送入Covariate(s)框中。(6)在transform框中选择Log Base 10选项,在Option对话框选择Parallelism test,其他参数选项均为默认值。(7)单击OK按钮进行统计分析。返回第3题分析1.根据上表得出建立的模型为Probit(p)=1.38+3.77(Log10(current)2.皮尔逊拟合优度的卡方检验显著水平值(0.122)大于0.05,所以可以判断模型对数据的拟合优度是满意的。返回第3题结论从上表中可以发现电流超过1.05毫安时,就需要进行新的农场选址。返回真实的数据和正确的方法是预测的基本条件 返回