《SPSS回归分析作业(共22页).doc》由会员分享,可在线阅读,更多相关《SPSS回归分析作业(共22页).doc(22页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、精选优质文档-倾情为你奉上回归分析作业一、利用软件计算1、 数据文件“资产评估1”提供了35家上市公司资产评估增值的数据。 num-公司序号pg- 资产评估增值率gz-固定资产在总资产中所占比例fz-权益与负债比bc-总资产投资报酬率gm-公司资产规模(亿元)a. 建立关于资产评估增值率的四元线性回归方程,并通过统计分析、检验说明所得方程的有效性,解释各回归系数的经济含义。b. 剔除gz变量,建立关于资产评估增值率的三元线性回归方程,与a中的模型相比较,那个更为实用有效,说明理由。解:a. SPSS数据如下Model SummaryModelRR SquareAdjusted R Square
2、Std. Error of the Estimate1.871a.759.727.a. Predictors: (Constant), 公司规模, 权益与负债比, 固定资产比重, 总资产投资报酬率ANOVAbModelSum of SquaresdfMean SquareFSig.1Regression.5864.14623.609.000aResidual.18630.006Total.77234a. Predictors: (Constant), 公司规模, 权益与负债比, 固定资产比重, 总资产投资报酬率b. Dependent Variable: 资产评估增值率Coefficients
3、aModelUnstandardized CoefficientsStandardized CoefficientstSig.BStd. ErrorBeta1(Constant).396.1452.736.010固定资产比重.079.082.092.972.339权益与负债比.062.016.4163.918.000总资产投资报酬率.602.130.4934.618.000公司规模-.044.014-.304-3.201.003a. Dependent Variable: 资产评估增值率Residuals StatisticsaMinimumMaximumMeanStd. DeviationN
4、Predicted Value-.35Residual-1.E-1.35Std. Predicted Value-1.9572.452.0001.00035Std. Residual-1.9051.897.000.93935a. Dependent Variable: 资产评估增值率由Model Summary和ANOVA表 可知,R为0.871,决定系数R2为0.759,校正决定系数为0.727。拟合的回归模型F值为23.609,P值为0,所以拟合的模型是有统计意义的。从系数的t检验可以看出,只有固定资产比重的sig值=0.3390.05,说明只有固定资产比重对资产评估增值率的影响是不显著的
5、,其他自变量对固定资产增值的比率均有显著的影响。线性回归方程为:pg=0.396+0.079gz+0.063fz+0.602bc-0.044gm1=0.079表示,在权益与负债比、总资产投资报酬率和公司规模不变的条件下,固定资产比重每增加1个单位,资产评估增值率增加0.079。2=0.063表示,在固定资产比重、总资产投资报酬率和公司规模不变的条件下,权益与负债比每增加1个单位,资产评估增值率增加0.063。3=0.602表示,在固定资产比重、权益与负债比和公司规模不变的条件下,总资产投资报酬率每增加1个单位,资产评估增值率增加0.602。4=-0.044表示,在固定资产比重、权益与负债比和总
6、资产投资报酬率不变的条件下,公司规模每增加1亿元,资产评估增值率减少0.044b. Model SummarybModelRR SquareAdjusted R SquareStd. Error of the Estimate1.867a.751.727.a. Predictors: (Constant), 公司规模, 权益与负债比, 总资产投资报酬率b. Dependent Variable: 资产评估增值率ANOVAbModelSum of SquaresdfMean SquareFSig.1Regression.5803.19331.218.000aResidual.19231.006T
7、otal.77234a. Predictors: (Constant), 公司规模, 权益与负债比, 总资产投资报酬率b. Dependent Variable: 资产评估增值率CoefficientsaModelUnstandardized CoefficientsStandardized CoefficientstSig.BStd. ErrorBeta1(Constant).376.1432.628.013权益与负债比.063.016.4223.981.000总资产投资报酬率.600.130.4914.607.000公司规模-.040.013-.275-3.052.005a. Depend
8、ent Variable: 资产评估增值率Residuals StatisticsaMinimumMaximumMeanStd. DeviationNPredicted Value-.35Residual-1.E-1.35Std. Predicted Value-1.7982.598.0001.00035Std. Residual-2.0491.847.000.95535a. Dependent Variable: 资产评估增值率由Model Summary和ANOVA表 可知,相关系数R为0.867,决定系数R2为0.751,校正决定系数为0.727。从系数的t检验可以看出,该模型的回归系数
9、都通过检验。所以,剔除 gz 变量,建立关于资产评估增值率的三元线性回归方程为:pg=0.376+0.063fz+0.600bc-0.040gmb更为有效实用,因为所有的回归系数都通过了t检验,并且b模型估计的标准误较小。2、数据文件“房产销售”提供了20件房地产的销售价格和评估的数据(美元):y-销售价格; x1-地产评估价值; x2-房产评估价值;x3-面积(平方英尺)。a. 建立适当的关于销售价格的多元线性回归模型.b. 利用模型预测地产评估价值为2000,房产评估价值为12000,面积为1100的销售价格,并给出预测值的95%的置信区间。c. 通过对模型的统计检验说明预测值的可信度。解
10、:a. SPSS数据如下CoefficientsaModelUnstandardized CoefficientsStandardized CoefficientstSig.BStd. ErrorBeta1(Constant)1475.6485742.859.257.800地产价值.814.512.1931.589.132房产价值.821.211.5573.890.001面积13.5096.583.2772.052.057a. Dependent Variable: 销售价格由图表所知,地产价值的sig值过高,所以地产价值对销售价格的影响不显著。把地产价值剔除后,所得的数据如下:Model S
11、ummarybModelRR SquareAdjusted R SquareStd. Error of the Estimate1.939a.881.8678262.430a. Predictors: (Constant), 面积, 房产价值b. Dependent Variable: 销售价格ANOVAbModelSum of SquaresdfMean SquareFSig.1Regression8.623E924.311E963.153.000aResidual1.161E9176.827E7Total9.783E919a. Predictors: (Constant), 面积, 房产价
12、值b. Dependent Variable: 销售价格CoefficientsaModelUnstandardized CoefficientsStandardized CoefficientstSig.95% Confidence Interval for BBStd. ErrorBetaLower BoundUpper Bound1(Constant)105.3825927.158.018.986-12399.82712610.592房产价值.961.200.6514.797.000.5381.384面积16.3486.615.3362.472.0242.39230.304a. Depe
13、ndent Variable: 销售价格Residuals StatisticsaMinimumMaximumMeanStd. DeviationNPredicted Value21387.191.06E55.67E421303.09620Residual-1.582E41.387E4.0007815.47620Std. Predicted Value-1.6562.330.0001.00020Std. Residual-1.9151.679.000.94620a. Dependent Variable: 销售价格由Coefficients表所知,回归方程为:y=105.382+0.961x2
14、+16.348x3 b.解:通常先做enter,然后做逐步(1)对原数据进行回归分析,得到回归方程为:y=105.382+0.961x2+16.348x3(2)地产评估价值为2000,房产评估价值为12000,面积为1100的销售价格的95%的置信区间为:(21468.99197,37776.93332)。(3)该模型的Adjusted R Square=0.867,也就是这两个自变量可以解释86.7%的因变量变差,应该说是预测的可信度比较高;并且残差符合正态性、独立性和方差齐次性,模型成立,即有95%的可能性b的预测值在区间21468.99197-37776.93332内。3、大多数公司都提
15、供了估计值,以反映证券的系统风险。一种股票的值所测量的是这种股票的回报率与整个市场平均回报率之间的关系。这个指标的名称就来自简单线性回归中的斜率参数。在这种回归中,因变量是股票回报率(Y)。而自变量则是市场回报率(X)。 值大于1的股票被称为“攻击性”证券,因为它们的回报率变动(向上或向下)得比整个市场的回报率快。相反,值小于1的股票被称为“防御性”证券,因为它们的回报率变动的比市场回报率慢。 值接近1的股票被称为“中性”证券,因为它们的回报率反映市场回报率。下面表中的数据是随机抽选的7个月内某只特定的股票的月回报率及整个市场的回报率。试对这些数据完成简单线性回归分析。根据你的分析结果,你认为
16、这只股票是属于攻击性,防御性,还是中性的股票?月 股票回报率Y 市场回报率X1 12.0 7.22 1.3 0.03 2.5 2.14 18.6 11.95 9.0 5.36 3.8 1.27 10.0 4.7解: SPSS数据如下:CoefficientsaModelUnstandardized CoefficientsStandardized CoefficientstSig.BStd. ErrorBeta1(Constant)-1.329.323-4.109.009X1.762.054.99832.539.000a. Dependent Variable: Y得到回归方程:y=1.762
17、x-1.329。值为线性回归斜率参数1.7621,所以,该股票属于“攻击性股票”。4、参考上题。股票的值是否依赖于计算回报率的时间长度?因为有些经济商号用的是按月数据计算的值,另一些经济商号则用按年数据计算的值,所以这个问题对投资者来说很重要。H.莱维分别研究了三类股票的时间长度(月)和平均值。将时间长度从一个月逐步增加到30个月,莱维计算了1946-1975年间144只股票的回报率。根据他所得的值,这144只股票中有38只攻击性股票,38只防御性股票,以及68只中性股票。下表中给出的这三类股票对不同时间水平的平均值。A、 对于攻击性股票、防御性股票和中性股票三种情况,分别求表达平均值Y与时间
18、长度X之间关系的最小二乘简单线性回归方程。B、 对每一类股票检验假设:时间长度是平均值的有效线性预测器,检验时用=0.05。C、 对每一类股票,构造直线斜率的95%置信区间,哪只股票的值随时间长度的增大而线性增大?时间长度X,月 值, Y攻击性股票 防御性股票 中性股票136912151824301.37 0.50 0.981.42 0.44 0.95 1.53 0.41 0.941.69 0.39 1.00 1.83 0.40 0.98 1.67 0.38 1.00 1.78 0.39 1.02 1.86 0.35 1.14 1.83 0.33 1.22CoefficientsaModelU
19、nstandardized CoefficientsStandardized CoefficientstSig.95% Confidence Interval for BBStd. ErrorBetaLower BoundUpper Bound1(Constant)1.451.05924.392.0001.3101.591x.016.004.8564.377.003.007.025a. Dependent Variable: yCoefficientsaModelUnstandardized CoefficientsStandardized CoefficientstSig.95% Confi
20、dence Interval for BBStd. ErrorBetaLower BoundUpper Bound1(Constant).459.01334.178.000.428.491x-.005.001-.901-5.488.001-.007-.003a. Dependent Variable: yCoefficientsaModelUnstandardized CoefficientsStandardized CoefficientstSig.95% Confidence Interval for BBStd. ErrorBetaLower BoundUpper Bound1(Cons
21、tant).911.02537.083.000.853.969x.009.002.9065.672.001.005.012a. Dependent Variable: y5个人计算机(PC机)正以非凡的技术在发展,PC机的零售价格也是这样。由于购买时间和机器特点不同,一台PC机的零售价格可能发生戏剧性的变化。不久前收集了一批IBM PC机和IBM PC兼容机的零售价格数据,共有N=60,见数据文件“计算机价格”。这些数据被用来拟合多元回归 E(Y)=0+1 x1+2x2其中:Y=零售价格(美元)x1=微处理器速度(兆赫)a、 试写出最小二乘预测方程。b、 此模型是否适合于预测?用=0.10进行
22、检验。c、 构造1 的90%置信区间,并对此区间作出解释。d、 本模型中的CPU芯片(x2)是否是价格(Y)的有效预测器?用=0.10进行预测。Model SummarybModelRR SquareAdjusted R SquareStd. Error of the Estimate1.610a.373.350962.967a. Predictors: (Constant), 芯片, 速度b. Dependent Variable: 价格yModel SummarybModelRR SquareAdjusted R SquareStd. Error of the Estimate1.610a
23、.373.350962.967a. Predictors: (Constant), 芯片, 速度b. Dependent Variable: 价格yCoefficientsaModelUnstandardized CoefficientsStandardized CoefficientstSig.95% Confidence Interval for BBStd. ErrorBetaLower BoundUpper Bound1(Constant)-68.5091461.468-.047.963-2996.1812859.162速度108.23721.198.5825.106.00065.77
24、2150.702芯片2.4864.174.068.596.554-5.87610.848a. Dependent Variable: 价格y6、在工厂中,准确估计完成一项作业所需的工时数对于诸如决定雇佣工人的数量,确定向客户报价的最后期限,或者作出与预算有关的成本分析决策等决策管理来说是极端重要的。一名锅炉筒制造商想预测在一些在未来预测项目中装配锅炉筒所需的工时数。为了用回归方法实现此目标,他收集了35个锅炉的项目数据(数据文件“锅炉”)。除工时(Y)外,被测量的变量有锅炉工作容量(X1=磅/小时),锅炉设计压力(X2=磅/平方英寸),锅炉的类型(X3=1,如在生产领域装配;X3=0,如在使用
25、领域装配),以及炉筒类型(X4=1,蒸汽炉筒;X4=0,液体炉筒)。A、 试检验假设:锅炉容量(X1)与工时数(Y)之间有正线性关系。B、 试检验假设:锅炉压力(X3)与工时数(Y)之间有正线性关系。C、 构造1的95%置信区间并对结果做出解释。D、 构造3的95%置信区间。Correlations工时y容量x1工时yPearson Correlation1.827*Sig. (2-tailed).000N3535容量x1Pearson Correlation.827*1Sig. (2-tailed).000N3535*. Correlation is significant at the 0
26、.01 level (2-tailed).Correlations工时y压力x2工时yPearson Correlation1.657*Sig. (2-tailed).000N3535压力x2Pearson Correlation.657*1Sig. (2-tailed).000N3535*. Correlation is significant at the 0.01 level (2-tailed).CoefficientsaModelUnstandardized CoefficientsStandardized CoefficientstSig.95% Confidence Interv
27、al for BBStd. ErrorBetaLower BoundUpper Bound1(Constant)-3727.2681227.784-3.036.005-6234.737-1219.800容量x1.009.001.9039.491.000.007.011压力x21.898.661.3882.873.007.5493.247炉类型x33410.104926.871.5313.679.0011517.1805303.027筒类型x42118.726314.805.3926.730.0001475.8092761.644a. Dependent Variable: 工时y7Cushma
28、n & Wakefield 股份有限公司,采集了美国市场上办公用房的空闲率和租金率的数据。对于18个选取的销售地区,这些地区的中心商业区的综合空闲率(%)和平均租金率(美元/平方英尺)的数据(The Wall Journal Almanac1988)见文件“办公用房”。a. 用水平轴表示空闲率,对这些数据画出散点图。b. 这两个变量之间显出什么关系吗?c. 求出在办公用房的综合空闲率已知时,能用来预测平均租金率的估计的回归方程。d. 在0.05显著水平下检验关系的显著性。e. 估计的回归方程对数据的拟合好吗?请解释。f. 在一个综合空闲率是25%的中心商业区,预测该市场的期望租金率。g. 在劳
29、德代尔堡的中心商业区,综合空闲率是11.3%,预测劳德代尔堡的期望租金率。Correlations综合空闲平均租金综合空闲Pearson Correlation1-.659*Sig. (2-tailed).003N1818平均租金Pearson Correlation-.659*1Sig. (2-tailed).003N1818*. Correlation is significant at the 0.01 level (2-tailed).CoefficientsaModelUnstandardized CoefficientsStandardized CoefficientstSig.9
30、5% Confidence Interval for BBStd. ErrorBetaLower BoundUpper Bound1(Constant)37.0753.52810.510.00029.59644.553综合空闲-.779.222-.659-3.504.003-1.251-.308a. Dependent Variable: 平均租金Variables Entered/RemovedbModelVariables EnteredVariables RemovedMethod1综合空闲a.Entera. All requested variables entered.b. Depe
31、ndent Variable: 平均租金Model SummarybModelRR SquareAdjusted R SquareStd. Error of the EstimateDurbin-Watson1.659a.434.3994.884742.456a. Predictors: (Constant), 综合空闲b. Dependent Variable: 平均租金ANOVAbModelSum of SquaresdfMean SquareFSig.1Regression292.9141292.91412.276.003aResidual381.7711623.861Total674.
32、68517a. Predictors: (Constant), 综合空闲b. Dependent Variable: 平均租金Residuals StatisticsaMinimumMaximumMeanStd. DeviationNPredicted Value19.309932.399825.39174.1509318Std. Predicted Value-1.4651.688.0001.00018Standard Error of Predicted Value1.1572.3081.590.36118Adjusted Predicted Value19.229932.061625.4
33、0494.2035218Residual-6.366928.37020.000004.7389018Std. Residual-1.3031.714.000.97018Stud. Residual-1.3421.798-.0011.01618Deleted Residual-6.745069.21847-.013215.1955718Stud. Deleted Residual-1.3791.949.0131.05218Mahal. Distance.0092.850.944.87318Cooks Distance.000.164.047.04818Centered Leverage Valu
34、e.001.168.056.05118a. Dependent Variable: 平均租金8PJH&D公司正在决定是否为公司新的文字处理系统签订一项维修合同。公司的管理人员认为,维修费用与该系统的使用时间有关。采集的每周时间(小时)和面维修费用(千美元)的统计资料见“文字处理系统”。a. 求出年维修费用对于每周使用时间的估计的回归方程。b. 在0.05显著水平下, 检验在(a)中求出关系的显著性。c. PJH&D公司预期每周使用文字处理系统的时间是30小时,求出该公司的年维修费用的 95%的预测区间。d. 如果维修合同 的费用是每年3000美元,你建议签订这个合同吗,为什么?Model Su
35、mmaryModelRR SquareAdjusted R SquareStd. Error of the Estimate1.925a.856.8394.2102a. Predictors: (Constant), 使用时间e.f.ANOVAbModelSum of SquaresdfMean SquareFSig.1Regression846.0921846.09247.732.000aResidual141.808817.726Total987.9009a. Predictors: (Constant), 使用时间b. Dependent Variable: 年维修费g.Coeffici
36、entsaModelUnstandardized CoefficientsStandardized CoefficientstSig.BStd. ErrorBeta1(Constant)10.6753.7102.877.021使用时间.946.137.9256.909.000a. Dependent Variable: 年维修费9对于一个较大的人口密集的地区 ,当地交通部门想要确定公共汽车的使用时间和年维修费用之间是否存在某种关系。由10辆公共汽车组成一个样本,采集的数据见文件“交通”。a. 利用最小二乘法求出估计的回归方程。b. 在=0.05的显著水平下, 通过检验是否看出二变量之间存在一个
37、显著的关系。c. 最小二乘法回归线给出了观测数据一个好的拟合吗?请做出解释。d. 如果有一辆特定的公共汽车已使用了4年,求出这辆车年维修费用的一个95%的预测区间。Model SummaryModelRR SquareAdjusted R SquareStd. Error of the Estimate1.934a.873.85775.498a. Predictors: (Constant), 使用时间ANOVAbModelSum of SquaresdfMean SquareFSig.1Regression.0001.00054.746.000aResidual45600.00085700.
38、000Total.0009a. Predictors: (Constant), 使用时间b. Dependent Variable: 年维修费CoefficientsaModelUnstandardized CoefficientsStandardized CoefficientstSig.95% Confidence Interval for BBStd. ErrorBetaLower BoundUpper Bound1(Constant)220.00058.4813.762.00685.143354.857使用时间131.66717.795.9347.399.00090.631172.702a. Dependent Variable: 年维修费10美国心脏协会经过10年的研究,得到了与发生中风有关的年龄、血压和吸烟的统计资料。假设这一研究的部分数据为文件“中风风险”。我们将病人在今后10年内发生中风的概率(乘1