《北科SPSS软件练习试题(9页).doc》由会员分享,可在线阅读,更多相关《北科SPSS软件练习试题(9页).doc(11页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、-北科SPSS软件练习试题-第 11 页Spss第 4 次作业第1题(1)【实验目的】学会用spss进行相关分析(2)【实验内容】1、对15家商业企业进行客户满意度调查,同时聘请相关专家对这15家企业的综合竞争力进行评分,结果如下表编号客户满意度得分综合竞争力得分190702100803150150413014051209061101207402081401309106010203011801001270110133010145040156050这些数据能否说明企业的客户满意度与综合竞争力存在较强的正相关关系?为什么?(3)【操作步骤】1. 输入数据图形散点图/点图选择“简单散点图”定义将“综
2、合竞争得分”导入“Y轴”将“客户满意度得分”导入“X轴”确定;2.在数据输出窗口,双击图形空白处元素总计拟合线线性应用;3. 分析回归线性添加客户满意度得分到因变量,综合竞争力的分到自变量确定(4)【输出结果】输入/除去的变量a模型输入的变量除去的变量方法1综合竞争力得分b.输入a. 因变量:客户满意度得分b. 已输入所请求的所有变量。模型摘要模型RR 方调整后 R 方标准估算的误差1.864a.747.728a. 预测变量:(常量), 综合竞争力得分ANOVAa模型平方和自由度均方F显著性1回归1.000b残差13总计14a. 因变量:客户满意度得分b. 预测变量:(常量), 综合竞争力得分
3、系数a模型未标准化系数标准化系数t显著性B标准误差Beta1(常量).856.408综合竞争力得分.864.140.864.000a. 因变量:客户满意度得分(5)【结果分析】拟合线性直线的方程为:y=10.86+0.86x, 相关系数r为0.864,当显著性水平为0.01时拒绝原假设,表明两个变量(企业的客户满意度与综合竞争力)之前具有较强的线性关系,相关性显著。第2题(1)【实验目的】 学会用spss进行相关分析(2)【实验任务】 为研究香烟消耗量与肺癌死亡率的关系,收集到下表数据。国家1930年人均香烟消耗量1950年每百万男子中死于肺癌的人数澳大利亚480180加拿大500150丹麦3
4、80170芬兰1100350英国1100460荷兰490240冰岛23060挪威25090瑞典300110瑞士510250美国1300200绘制散点图,并计算相关系数,说明香烟消耗量与肺癌死亡率之间是否存在显著的相关关系。(3)【操作步骤】1. 输入数据图形散点图/点图选择“简单散点图”定义将“1950年每百万男子中死于肺癌的人数”导入“Y轴”将“1930年人均香烟消耗量”导入“X轴”确定;2.在数据输出窗口,双击图形空白处元素总计拟合线线性应用;3.在数据编辑窗口,分析相关双变量将“1930年人均香烟消耗量”、“1950年每百万男子中死于肺癌的人数”导入变量中选项选中“平均值和标准差”、“叉
5、积偏差和协方差”继续确定。(4)【输出结果】描述统计平均值标准差个案数客户满意度得分15综合竞争力得分15相关性客户满意度得分综合竞争力得分客户满意度得分皮尔逊相关性1.864*显著性(双尾).000平方和与叉积协方差个案数1515综合竞争力得分皮尔逊相关性.864*1显著性(双尾).000平方和与叉积协方差个案数1515*. 在 0.01 级别(双尾),相关性显著。(5)【结果分析】,皮尔逊相关系数相差较大,可能是有最后几组差异较大的数据点所影响。线性回归方程:1950年每百万男子中死于肺癌人数=67.561+ 1930年人均香烟消耗量*0.228。第3题(1)【实验目的】 学会用spss进
6、行相关分析(2)【实验任务】 收集到某商品在不同地区的销售额,销售价格以及该地区平均家庭收入的数据,如下表所示:销售额(万元)销售价格(元)家庭收入(元)1005010000757060008060120007060500050803000657040009050130001004011000110301300060903000(1) 绘制销售额,销售价格以及家庭收入两两变量间的散点图,如果所绘制的图形不能比较清晰地展示变量之间的关系,应对数据如何处理后再绘图?(2) 选择恰当的统计方法分析销售额与销售价格之间的相关关系。(3)【操作步骤】步骤:图形旧对话框散点图矩阵散点图定义添加销售额(万元
7、),销售价格(元)家庭收入(元)确定步骤:分析相关双变量销售价格,家庭收入,销售额添加到变量中选择皮尔逊相关系数选择双尾显著性检验确定(4)【输出结果】相关性销售价格(元)家庭收入(元)销售额(万元)销售价格(元)皮尔逊相关性1*显著性(双尾).002.000个案数101010家庭收入(元)皮尔逊相关性*1.880*显著性(双尾).002.001个案数101010销售额(万元)皮尔逊相关性*.880*1显著性(双尾).000.001个案数101010*. 在 0.01 级别(双尾),相关性显著。(5)【结果分析】1.从相关性分析表中得出:销售价格与家庭收入与销售额 三者两两相关,并且皮尔逊相关
8、系数绝对值较大成很强的相关性。2. 结论分析:如图所拟合的直线,销售额与销售价格由较强的负相关。回归分析第4题(1)【实验目的】 学会用spss进行回归分析(2)【实验任务】1、 数据 学生成绩一.sav 和 学生成绩二.sav ,任意选择两门成绩作为解释变量和被解释变量,利用SPSS提供的绘制散点图功能进行一元线性回归分析,请绘制全部样本以及不同性别下两门成绩的散点图,并在图上绘制三条回归直线,其中,第一条针对全体样本,第二条和第三条分别针对男生样本和女生样本,并对各回归直线的拟合效果进行评价。(3)【操作步骤】打开“学生成绩一.sav”图形散点图/点图简单散点图定义将数据导入“X轴”、“Y
9、轴”确定;在查看器中图形激活;选择元素总计拟合曲线和子组拟合曲线。分析回归线性将数据导入“因变量”、 “自变量”统计选中“共线性诊断”继续确定。(4)【输出结果】ANOVAa模型平方和自由度均方F显著性1回归1.007b残差58总计59a. 因变量:chib. 预测变量:(常量), math(5)【结果分析】上表得出,不论是总体拟合效果还是男女分类拟合效果,都比较差,这说明,这两门成绩的相关性弱。第5题(1)【实验目的】 建立多元线性回归方程,分析影响的主要因素。(2)【实验任务】 请先收集若干年粮食总产量以及播种面积,使用化肥量,农业劳动人数等数据,然后建立多元线性回归方程,分析影响粮食总产
10、量的主要因素,数据文件 “”(3)【操作步骤】分析回归线形(4)【输出结果】输入/除去的变量a模型输入的变量除去的变量方法1农业劳动者人数(百万人), 粮食播种面积(万公顷), 施用化肥量(kg/公顷)b.输入a. 因变量:粮食总产量(y万吨)b. 已输入所请求的所有变量。模型摘要模型RR 方调整后 R 方标准估算的误差1.986a.971.968a. 预测变量:(常量), 农业劳动者人数(百万人), 粮食播种面积(万公顷), 施用化肥量(kg/公顷)ANOVAa模型平方和自由度均方F显著性1回归3.000b残差31总计34a. 因变量:粮食总产量(y万吨)b. 预测变量:(常量), 农业劳动
11、者人数(百万人), 粮食播种面积(万公顷), 施用化肥量(kg/公顷)系数a模型未标准化系数标准化系数t显著性B标准误差Beta1(常量).009粮食播种面积(万公顷).513.154.000施用化肥量(kg/公顷).690.000农业劳动者人数(百万人).461.000风灾面积比例(%).001a. 因变量:粮食总产量(y万吨)(5)【结果分析】结论分析:从最后的系数的分析表中得出,其中施用化肥量与粮食总产量的相关性最大。第6题(1)【实验目的】 完成下列题目(2)【实验任务】 一家产品销售公司在30个地区设有销售分公司。为研究产品销售量(y)与销售价格(x1)各地区的人均收入(x2),广告
12、费用(x3)之间的关系,搜集到30个地区的有关数据。进行多元回归分析所得的结果如下: 表1模型离差平方和Df均方离差FSig回归3剩余26总计294063994.4154 表2 非标准化系数tSigB标准误差常数2448X1X2X3a) 将表 1 中的数据补齐. 如图一b) 写出销售量与销售价格,年人均收入,广告费用的多元线性回方程,并解释各回归系数的意义。Yc) 检验回归方程的线性关系是否显著。显著d) 检验各回归系数是否显著,均小于0.05,显著e) 计算判定系数,并解释它的实际意义。 表明回归方程对样本数据点拟合优度高。第7题(1)【实验目的】 用spss预测数据,并估计误差(2)【实验
13、任务】 试根据“”数据,利用SPSS曲线估计方法选择恰当的模型,对样本期外的粮食总产量进行外推预测,并对平均预测预测误差进行估计。(3)【操作步骤】图形,旧对话框,线图,简单,个案组摘要,定义,类别轴选择“年份”,其他统计量变量选择“粮食总产量”。确定步骤:分析,回归,曲线估计,将“粮食总产量”导入因变量。选择时间,选择二次项和指数分布。保存,确定。(4)【输出结果】二次模型汇总RR 方调整 R 方估计值的标准误.978.957.955ANOVA平方和df均方FSig.回归2.000残差32总计34系数未标准化系数标准化系数tSig.B标准误Beta个案顺序.158个案序列 * 2.000(常数).000指数模型汇总RR 方调整 R 方估计值的标准误.939.881.878.107ANOVA平方和df均方FSig.回归1.000残差.38133.012总计34系数未标准化系数标准化系数tSig.B标准误Beta个案顺序.028.002.939.000(常数).000因变量为 ln(粮食总产量(y万吨)。(5)【结果分析】分析1 :由线图可以看出,粮食总产量非线性增加,因此,可以通过曲线估计进行分析。所以在用二次曲线和指数曲线拟合。分析2:指数曲线模型,明显优于二次曲线模型,所以利用指数模型进行合理预测未来粮食总产量。