《统计学spss课后题答案(共36页).doc》由会员分享,可在线阅读,更多相关《统计学spss课后题答案(共36页).doc(36页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、精选优质文档-倾情为你奉上实操训练答案目录专心-专注-专业第一章(一)思考题 略(二)练习题1.(1)定类变量(2)定类变量(3)定序变量(4)数值型变量(5)数值型变量2. A3. B4. A B C D5. D A6. A B (三)操作题 略第二章(一)思考题 略(二)练习题1. BD AC2. C3. D4. D5. A(三)操作题 1. 见SPSS文件2.1.sav。2. 略。3. 略。4. 略。第三章1. 2011年人均国内生产总值(agdp2011),排在前五位的是天津、上海、北京、江苏、浙江;排在后五位的是广西、西藏、甘肃、云南、贵州。. 2011年国内生产总值(gdp2011
2、),在东部各省市里,排在第1位的是广东,排在最后1位的分别是海南;在中部各省市里,排在第1位的是河南,排在最后1位的分别是吉林;在西部各省市里,排在第1位的是四川,排在最后1位的分别是西藏。2. 见SPSS文件3.2.sav。3. 见SPSS文件3.3.sav。4. A老师提供的管理学成绩见SPSS文件3.4-1.sav,B老师提供的经济学成绩见SPSS文件3.4-2.sav,合并后的文件见SPSS文件3.4.sav。5. 见SPSS文件3.5.sav。6. 见SPSS文件3.6.sav。7. 见SPSS文件3.7.sav。8. 见SPSS文件3.8.sav。9. 两门课程都在80分以上的共4
3、人,见SPSS文件3.5.sav。10. 管理学成绩在80-89,经济学成绩在90分以上的只有1人,见SPSS文件3.6.sav。第四章1. 由于变量品牌(brand)是定类变量,所以分别用众数和异众比来描述其集中趋势和离散趋势。由分析结果可知,众数是B,异众比是(800-279)/800=65.1%。 统计量品牌N有效800缺失0众数2 品牌频率百分比有效百分比累积百分比有效A16420.520.520.5B27934.934.955.4C11013.813.869.1D556.96.976.0E19224.024.0100.0合计800100.0100.02由于变量统计学这门课程难吗(v2
4、.4)是定序变量,所以用众数,中位数,四分位数来描述其集中趋势,用四分位差来描述其离散趋势。由分析结果可知,四分位差是3-2=1。统计量您认为统计学这门课程难吗?N有效255缺失0中值3.00众数3百分位数252.00503.00753.00您认为统计学这门课程难吗?频率百分比有效百分比累积百分比有效非常难103.93.93.9难9537.337.341.2一般13854.154.195.3简单83.13.198.4很简单41.61.6100.0合计255100.0100.03. 录入后的数据见SPSS文件4.3.sav。(1)数据中只有定类和定序变量,对于定类变量可以用用众数和异众比来描述其
5、集中趋势和离散趋势。对于定序变量,可以众数,中位数,四分位数来描述其集中趋势,用四分位差来描述其离散趋势。(2)可以用条形图或饼图。先对数据进行加权,然后将中国队筛选出来,再通过频数分析做出条形图。(3)可以用条形图或饼图。先对数据进行加权,然后将中国队筛选出来,再通过频数分析做出饼图。(4)可以用条形图或饼图。先对数据进行加权,再通过频数分析做出饼图。4. 录入后的数据见SPSS文件4.4.sav。采用基本的描述性统计可得如下结果,所以四分位差为391.25-360.25=31。还可以通过基本的描述性统计计算Z分数,可知368的标准分数为-0.08618。统计量销售额N有效30缺失0均值37
6、0.77中值372.50众数238a标准差32.104方差1030.668偏度-2.371偏度的标准误.427峰度9.677峰度的标准误.833百分位数25360.2550372.5075391.25a. 存在多个众数。显示最小值5. 使用探索性分析完成本题,结果见SPSS文件4.5.spv。第五章(一)思考题 略(二)练习题1. A 2. B3. C4. 绩效得分,连续的5. 测量得分,连续的6. 录入后的数据见SPSS文件5.6.sav,将变量概率(p)作为权重变量进行加权,再通过频数分析绘制直方图如下所示。7使用探索分析绘制正态概率图,的如下结果,可知两个变量都是非正态分布。正态性检验K
7、olmogorov-SmirnovaShapiro-Wilk统计量dfSig.统计量dfSig.每股收益(元).182923.000.759923.000净资产收益率(%).295923.000.438923.000a. Lilliefors 显著水平修正sig的值小于0.05说明不服从正态分布8 第一步,先列出样本容量为3的所有样本。组合 中位数1,3,5 31,3,7 31,3,9 31,5,7 51,5,9 51,7,9 73,5,7 53,5,9 53,7,9 75,7,9 7第二步,统计中位数出现的频数。中位数 频数 概率3 3 3/10=0.35 4 4/10=0.47 3 3/1
8、0=0.3第三步,数据录入后,结果见SPSS文件5.8.sav,将变量频率(f)作为权重变量进行加权,再通过频数分析绘制直方图如下所示。第六章(一)思考题 略(二)练习题1. A2. B3. A4. B5. B(三)操作题 1. 采用平均数分析过程,计算平均数。报告CEO年度报酬CSRC行业分类均值N标准差农林牧渔.7225.287采掘业.1156.666制造业.111644.395电力、煤气及水的生产和供应业.41196.480建筑业.70100.285交通运输、仓储业.31336.014信息技术业.33350.810批发和零售贸易.84560.226金融、保险业.98585.768房地产业
9、.44280.784社会服务业.00110.868传播与文化产业.65516.617总计.214758.837(2)报告CEO年度报酬地区均值N标准差东部.062832.082中部.11747.242西部.09780.544东北.58399.008总计.214758.837(3)报告CEO年度报酬地区CSRC行业分类均值N标准差东部农林牧渔.0011.667采掘业.9224.650制造业.92795.958电力、煤气及水的生产和供应业.9576.197建筑业.3165.725交通运输、仓储业.60216.075信息技术业.70266.402批发和零售贸易.89376.125金融、保险业.974
10、05.283房地产业.19170.839社会服务业.0044.314传播与文化产业.38384.058总计.062832.082中部农林牧渔.00463956.053采掘业.0016.560制造业.05354.860电力、煤气及水的生产和供应业.8936.351建筑业.671528109.826交通运输、仓储业.0060.901信息技术业.3342.443批发和零售贸易.0064.282金融、保险业.0045.826房地产业.003051653.688社会服务业.6733.455传播与文化产业.7548.882总计.11747.242西部农林牧渔.008.332采掘业.0016.430制造业.
11、90375.194电力、煤气及水的生产和供应业.3152.812建筑业.0015.284交通运输、仓储业.0030.354信息技术业.3321.292批发和零售贸易.4472.707金融、保险业.7163.284房地产业.8670.981社会服务业.0022.404传播与文化产业.6736.810总计.09780.544东北农林牧渔.002.745制造业.50120.478电力、煤气及水的生产和供应业.5032.637建筑业96000.005.000交通运输、仓储业.0030.244信息技术业.6721.877批发和零售贸易.3348.864金融、保险业.0072.882房地产业.0010.0
12、00社会服务业.0011.000传播与文化产业.0048.415总计.58399.008总计农林牧渔.7225.287采掘业.1156.666制造业.111644.395电力、煤气及水的生产和供应业.41196.480建筑业.70100.285交通运输、仓储业.31336.014信息技术业.33350.810批发和零售贸易.84560.226金融、保险业.98585.768房地产业.44280.784社会服务业.00110.868传播与文化产业.65516.617总计.214758.8372. (1)首先提出原假设和备择假设:(工作时间是每周40个小时);(工作时间不是每周40个小时)。(2)
13、采用单样本T检验,通过SPSS操作得到如下图表:单个样本统计量N均值标准差均值的标准误工时3046.579.3871.714单个样本检验检验值 = 40 TdfSig.(双侧)均值差值差分的 95% 置信区间下限上限工时3.83229.0016.5673.0610.07假定给定的显著性水平是0.05,由t值是3.832,值=0.0010.05,拒绝原假设,认为工作时间与每周40个小时在统计上有显著差异,由样本均值是46.57,我国员工工作时间远超过40小时。3.(1)首先提出原假设和备择假设:原假设(国有和非国有上市公司CEO薪酬没有显著差异);备择假设(国有和非国上市公司CEO薪酬有显著差异
14、)。采用独立样本T检验,通过SPSS操作得到如下图表:组统计量最终控制人类型N均值标准差均值的标准误CEO年度报酬dimension1国有633.14.42618091.162非国有359.05.52927525.751独立样本检验方差方程的 Levene 检验均值方程的 t 检验FSig.tdfSig.(双侧)均值差值标准误差值差分的 99% 置信区间下限上限CEO年度报酬假设方差相等8.864.0031.393990.16444194.9131728.74-37690.764.59假设方差不相等1.342663.92.18044194.9132938.69-40894.108.93首先根据
15、方差方程的Levene检验判断国有CEO报酬和非国有CEO报酬方差是否相等,提出原假设是方差相等,备择假设是方差不等。根据F值=8.864和值=0.0030.01(0.01,则不拒绝原假设,认为国有和非国有上市公司CEO薪酬没有显著差异。两者成绩平均数之差的99%的置信区间是-40894.108.93。(2)首先提出原假设和备择假设:原假设(本科及以上和本科以下教育水平CEO薪酬没有显著差异);备择假设(本科及以上和本科以下教育水平CEO薪酬有显著差异)。采用独立样本T检验,通过SPSS操作得到如下图表:组统计量CEO教育水平N均值标准差均值的标准误CEO年度报酬dimension1= 387
16、2.72.70516379.6310.01,判断出方差相等。再根据第一行数据中判断两组均值是否相等。第一行数据中的t值=2.806,值=0.0050.01,则拒绝原假设,认为本科及以上CEO报酬和本科以下CEO报酬方差存在显著差异。两者成绩平均数之差的99%的置信区间是10504.066.289。4. 首先提出原假设和备择假设:原假设(2011与2007年人均国内生产总值没有显著差异);备择假设(2011与2007年人均国内生产总值有显著差异)。采用配对样本T检验,通过SPSS操作得到如下图表:成对样本统计量均值N标准差均值的标准误对 12011年人均国内生产总值(元)39136.163118
17、614.0943343.1902007年人均国内生产总值(元)22221.843113787.1352476.243成对样本相关系数N相关系数Sig.对 12011年人均国内生产总值(元) & 2007年人均国内生产总值(元)31.964.000成对样本检验成对差分tdfSig.(双侧)均值标准差均值的标准误差分的 95% 置信区间下限上限对 12011年人均国内生产总值(元) - 2007年人均国内生产总值(元)16914.3236474.4931162.85314539.45919289.18614.54630.000给定的显著性水平是0.05,t值=14.546,值=00.05,因此拒绝
18、原假设,认为2011与2007年人均国内生产总值有显著差异,两者成绩平均数之差的95%的置信区间是14539.45919289.186。5. 录入后的数据见SPSS文件6.5.sav。首先提出原假设和备择假设:原假设(喝茶前后体重没有显著差异);备择假设(喝茶前后体重有显著差异)。采用配对样本T检验,通过SPSS操作得到如下图表:成对样本统计量均值N标准差均值的标准误对 1喝后69.92365.623.937喝前89.31365.296.883成对样本相关系数N相关系数Sig.对 1喝后 & 喝前36-.056.747成对样本检验成对差分tdfSig.(双侧)均值标准差均值的标准误差分的 95
19、% 置信区间下限上限对 1喝后 - 喝前-19.3897.9361.323-22.074-16.704-14.65835.000给定的显著性水平是0.05,t值=14.546,值=00.05,因此拒绝原假设,认为喝茶前后体重有显著差异,由于喝茶前体重的平均数远大于喝茶后体重的平均数,因此认为该减肥茶有较好的减肥效果。第七章(一)思考题 略(二)操作题1. 首先提出检验假设:原假设:专业方向与统计学学习难度之间不存在相关关系;备择假设:专业方向与统计学学习难度之间存在相关关系。采用交叉表分析及卡方检验得到如下图表,由=51.926,渐进的=00.05,则拒绝原假设,认为专业方向与统计学学习难两个
20、变量之间有相关关系,即不同专业方向的学生,其统计学学习难度有显著差异。您认为统计学这门课程难吗?* 专业方向 交叉制表专业方向合计人力资源管理国际连锁经营管理商务助理城市物流物业管理出版营销您认为统计学这门课程难吗?非常难计数05102210您认为统计学这门课程难吗? 中的 %.0%50.0%10.0%.0%20.0%20.0%100.0%难计数2972012141395您认为统计学这门课程难吗? 中的 %30.5%7.4%21.1%12.6%14.7%13.7%100.0%一般计数60202011261138您认为统计学这门课程难吗? 中的 %43.5%14.5%14.5%8.0%18.8%
21、.7%100.0%简单计数5000308您认为统计学这门课程难吗? 中的 %62.5%.0%.0%.0%37.5%.0%100.0%很简单计数1110014您认为统计学这门课程难吗? 中的 %25.0%25.0%25.0%.0%.0%25.0%100.0%合计计数953342234517255您认为统计学这门课程难吗? 中的 %37.3%12.9%16.5%9.0%17.6%6.7%100.0%卡方检验值df渐进 Sig. (双侧)Pearson卡方51.926a20.000似然比57.41620.000线性和线性组合7.2281.007有效案例中的 N255a. 18 单元格(60.0%)
22、的期望计数少于 5。最小期望计数0.27。观察卡方检验表的注释发现,有60%的单元格的期望频数都小于5,所以该结果是无效的,需要进行变量值的合并。将“您认为统计学这门课程难吗?”的变量值“非常难”和“难”合并,定义为“难”,将变量值“一般”“简单”“很简单”合并,定义为“不难”,再进行交叉分析和卡方检验,得到如下结果:统计学学习难度* 专业方向 交叉制表计数专业方向合计人力资源管理国际连锁经营管理商务助理城市物流物业管理出版营销统计学学习难度1.002912211216151052.0066212111292150合计953342234517255 卡方检验值df渐进 Sig. (双侧)Pea
23、rson 卡方23.393a5.000似然比24.4075.000线性和线性组合10.2051.001有效案例中的 N255a. 0 单元格(.0%) 的期望计数少于 5。最小期望计数为 7.00。所以,卡方值是23.393,P0.05,则拒绝原假设,认为学习难度和专业不存在相关关系。2. 录入后的数据见SPSS文件7.2.sav。采用交叉表分析、卡方检验及等级相关分析所得结果见SPSS文件7.2.spv。所以独立性的卡方值是8.075,性别与最高文凭之间的相关系数是0.003。3. 录入后的数据见SPSS文件7.3.sav。采用等级相关分析所得结果如下表,可见工作压力对满意度影响较低,相关系
24、数-0.182 ,值=00.05,说明两者的相关性较弱,且在统计上是显著的。对称度量值渐进标准误差a近似值 Tb近似值 Sig.按顺序-.182.049-3.670.000有效案例中的 N411a. 不假定零假设。b. 使用渐进标准误差假定零假设。4. 录入后的数据见SPSS文件7.4.sav。采用Kappa分析所得结果如下表,值=00.05,不拒绝原假设,认为三支队之间的射箭成绩没有显著差异。方差齐性检验成绩Levene 统计量df1df2显著性1.176245.318ANOVA成绩平方和df均方F显著性组间.0562.028.025.975组内49.194451.093总数49.25047
25、4. 录入后的数据见SPSS文件8.4.sav。首先提出检验假设:不同广告方案下的销售量平均数没有显著差异;:不同广告媒体下的销售量平均数没有显著差异;:广告方案和广告媒体之间没有对销量产生交互作用。:不同广告方案下的销售量平均数有显著差异;:不同广告媒体下的销售量平均数有显著差异;:广告方案和广告媒体之间对销量有交互作用。采用双因素方差分析,得如下结果,根据F值和P值,可知不同广告媒体下的销售量平均数没有显著差异;不同广告方案下的销售量平均数有显著差异;广告方案和广告媒体之间没有对销量产生交互作用。主体间效应的检验因变量:销售量源III 型平方和df均方FSig.校正模型448.000a58
26、9.6005.600.029截距3072.00013072.000192.000.000media48.000148.0003.000.134project344.0002172.00010.750.010media * project56.000228.0001.750.252误差96.000616.000总计3616.00012校正的总计544.00011a. R 方 = .824(调整 R 方 = .676)5. 录入后的数据见SPSS文件8.5.sav。首先提出检验假设:不同工作年限的销售量平均数没有显著差异;:不同职位的销售量平均数没有显著差异;:工作年限和职位之间没有对满意度产生交
27、互作用。:不同工作年限的销售量平均数有显著差异;:不同职位下的销售量平均数有显著差异;:工作年限和职位之间对满意度有交互作用。采用双因素方差分析,得如下结果,根据F值和P值,可知不同工作年限的满意度有显著差异;不同职位的满意度没有显著差异;工作年限和职位之间对满意度没有交互作用。主体间效应的检验因变量:满意度打分源III 型平方和df均方FSig.校正模型31.000a83.8753.875.030截距1058.00011058.0001058.000.000year24.333212.16712.167.003occup5.33322.6672.667.123year * occup1.33
28、34.333.333.849误差9.00091.000总计1098.00018校正的总计40.00017a. R 方 = .775(调整 R 方 = .575)第九章(一)思考题 略(二)操作题1. 录入后的数据见SPSS文件9.1.sav。(1)做出散点图,如下图所示。由图可知,价格与需求量之间应该存在线性关系。(2)采用相关分析得到如下表格,由表可知,需求量与价格的Pearson 相关系数为-0.926,且显著性水平为0,说明两个变量呈线性的负相关关系,且在统计上是显著的。相关性需求量价格需求量Pearson 相关性1-.926*显著性(双侧).000N1414价格Pearson 相关性-
29、.926*1显著性(双侧).000N1414*. 在 .01 水平(双侧)上显著相关。(3)建立一元线性回归模型,采用一元线性回归分析,得如下表格:R2=0.857,说明模型拟合较好;DW=1.230,说明残差的独立性欠佳;F=71.773,P=0,说明自变量与因变量呈显著线性关系;回归方程的常数项即截距为311.606,T检验值为12.048,显著性水平为0。回归方程的斜率为-0.052,t检验值为-8.472,显著性水平为00.05,拒绝原假设,认为自变量对因变量的影响是显著的。由此可以得出回归方程:回归系数-0.052的含义是,价格每增加1元,需求量减少0.052个。若16期的产品定价是
30、4800元,将4800代入回归方程,得到销售量是62。模型汇总b模型RR 方调整 R 方标准估计的误差Durbin-Watson1.926a.857.84517.429441.230a. 预测变量: (常量), 价格。b. 因变量: 需求量Anovab模型平方和df均方FSig.1回归21803.503121803.50371.773.000a残差3645.42512303.785总计25448.92913a. 预测变量: (常量), 价格。b. 因变量: 需求量系数a模型非标准化系数标准系数tSig.B标准 误差试用版1(常量)311.60625.86412.048.000价格-.052.0
31、06-.926-8.472.000a. 因变量: 需求量2. (1)做出散点图,如下图所示。由图可知,北京城镇居民家庭人均可支配收入(元)与城市人均居住使用面积(平方米)之间应该存在显著正线性关系。(2)采用相关分析得到如下表格,由表可知,需求量与价格的Pearson 相关系数为0.985,且显著性水平为0,说明两个变量呈线性的正相关关系,且在统计上是显著的。相关性城镇居民人均可支配收入(元)城市人均居住使用面积(平方米)城镇居民人均可支配收入(元)Pearson 相关性1.985*显著性(双侧).000N3434城市人均居住使用面积(平方米)Pearson 相关性.985*1显著性(双侧).
32、000N3434*. 在 .01 水平(双侧)上显著相关。(3)建立一元线性回归模型,采用一元线性回归分析,得如下表格:R2=0.971,说明模型拟合得很好;DW=0.224,说明残差不独立性;F=1063.901,P=0,说明自变量与因变量呈显著线性关系;回归方程的常数项即截距为8.766,T检验值为30.939,显著性水平为0。回归方程的斜率为0.001,T检验值为32.617,显著性水平为00.05,拒绝原假设,认为自变量对因变量的影响是显著的。由此可以得出回归方程:回归系数0.001的含义是,收入每增加1元,居住面积增加0.001平方米。若2012年的城镇居民家庭人均可支配收入是350
33、00元,将35000代入回归方程,得到居住面积是43.766。模型汇总b模型RR 方调整 R 方标准 估计的误差Durbin-Watson1.985a.971.9701.2059.224a. 预测变量: (常量), 城镇居民人均可支配收入(元)。b. 因变量: 城市人均居住使用面积(平方米)Anovab模型平方和df均方FSig.1回归1546.99911546.9991063.901.000a残差46.531321.454总计1593.53033a. 预测变量: (常量), 城镇居民人均可支配收入(元)。b. 因变量: 城市人均居住使用面积(平方米)系数a模型非标准化系数标准系数tSig.B标准 误差试用版1(常量)8.766.28330.939.000城镇居民人均可支配收入(元).001.000.98532.617.000a. 因变量: 城市人均居住使用面积(平方米)3. 录入后的数据见SPSS文件9.3.sav。建立二元线性回归模型,其中是虚拟变量,=0代表女性;=1代表男性。采用多元线性回归分析,得如下表格:R2=0.890,说明模型拟合得很好