《统计软件应用》实验实践项目指导书.docx

上传人:叶*** 文档编号:50256877 上传时间:2022-10-14 格式:DOCX 页数:36 大小:2.23MB
返回 下载 相关 举报
《统计软件应用》实验实践项目指导书.docx_第1页
第1页 / 共36页
《统计软件应用》实验实践项目指导书.docx_第2页
第2页 / 共36页
点击查看更多>>
资源描述

《《统计软件应用》实验实践项目指导书.docx》由会员分享,可在线阅读,更多相关《《统计软件应用》实验实践项目指导书.docx(36页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、统计软件应用实验实践项目指导书(2013 年 12月)编写人:陈章波目录项目 1:SPSS 统计软件简介与数据的录入.31.1实验实践课时.31.1实验实践目的.31.3实验实践条件.31.4实验实践背景知识.31.5实验实践内容.31.6实验实践步骤.31.7思考题.9项目 2:数据整理.102.1实验实践课时.102.1实验实践目的.102.3实验实践条件.102.4实验实践背景知识.102.5实验实践内容.102.6实验实践步骤.102.7思考题.15项目 3:重新分组&制表.163.1实验实践课时.163.1实验实践目的.163.3实验实践条件.163.4实验实践背景知识.163.5实

2、验实践内容.163.6实验实践步骤.163.7思考题.20项目 4:描述性统计分析.214.1实验实践课时.214.2实验实践目的.214.3实验实践条件.214.4实验实践背景知识.214.5实验实践内容.214.6实验实践步骤.214.7思考题.24项目 5:均值比较与假设检验.255.1实验实践课时.255.2实验实践目的.255.3实验实践条件.255.4实验实践背景知识.255.5实验实践内容.255.6实验实践步骤.255.7思考题.27项目 6:相关分析.286.1实验实践课时.286.2实验实践目的.286.3实验实践条件.286.4实验实践背景知识.286.5实验实践内容.2

3、86.6实验实践步骤.286.7思考题.31项目 7:单因素方差分析.327.1实验实践课时.327.2实验实践目的.327.3实验实践条件.327.4实验实践背景知识.327.5实验实践内容.327.6实验实践步骤.327.7思考题.35项目 1:SPSS 统计软件简介与数据的录入1.1实验实践课时2 学时1.1实验实践目的学习更改变量的属性、建立数据文件、读取外部数据、Excle 文件和对 spss 数据的编辑和保存。1.3实验实践条件学生单机操作,SPSS20.1.4实验实践背景知识基本的软件操作页面知识和 excel 等软件的操作经验。1.5实验实践内容把大学教师基本情况调查表中的 1

4、2 个变量在 SPSS 的变量窗口进行设置。把大学教师基本情况表中的数据在 SPSS 的数据窗口进行输入。1.6实验实践步骤1.打开 spss18,弹出的提示框点击取消,进入主页面。图 01-1主页面如上。2.按文件文件打开打开数据数据的顺序使用菜单命令调出打开文件打开文件对话框,在文件类型中选择“Excle(*.xls)”。图 01-2选择大学教师基本情况表,按 ok 键,导入数据。图 01-3在弹出的打开 excel 数据源窗口按确定。图 01-43.切换到变量视图,有 3 种方式可以进入变量视图。进入变量视图页面,首先,按照步骤一步一步检查类型类型,宽度宽度,小数小数,列列,对齐方式对齐

5、方式的设置是否有错误,确认无误后进入下一步。6 在“变量视图”变量框中的“标签”下填入变量的中文全称,并把“名称”中中文改为拼音缩写。5.在“值”下点击相应变量框,在“值标签”对话框中设置变量值标签,输入大学教师基本情况调查表中的问题的选项代表变量。每写完 1 个按添加。最后按确定。需要设置值标签的变量有性别性别(1.1.男男 2 2 女女),文化程度文化程度,职称职称,课时课时,数据库和数据库和科研要求,满意度。科研要求,满意度。接着修改度量标准,按照变量的不同类型分别设置标准。正确答案为下。6.切换回数据视图,打开“视图”中选择“值标签”,看改变后的效果。7.通过文件文件-保存保存菜单保存

6、数据文件。1.7思考题1 度量标准分为几种类型?那些变量属于度量,那些变量属于序号和名义?尝试举例说明。2 导入数据时除了 xls 文件还可以导入那些类型的文档?试了解一下。项目 2:数据整理2.1实验实践课时2 课时2.1实验实践目的掌握 spss13.0 建立数据文件的基本操作。(其中包括数据整理:数据菜单、转换菜单)2.3实验实践条件单人电脑操作,2.4实验实践背景知识有过 excel 的操作经验2.5实验实践内容案例操作:某高校今年对部分考生采取单独出题、提前录取的招生模式。现有 20 名来自国内不同省市的考生报考该校,7 个录取名额。根据该校所制定的录取原则,将文化课成绩和加分总和构

7、成综合分,录取出综合分排名前七名的学生。2.6实验实践步骤1.打开本次实验需要的 SAV 数据文件,在实验二文件夹中。2.在变量视图窗口中修改变量名称,标签和度量标准。(名称使用拼音首字母,标签为中文,以后相同),结果如下3.计算数据a 计算文化课成绩。点击转换计算变量目标变量设置为 whkcj,数学表达式为 sx+yw+yy+zh,最后设置类型和标签,如图所示,按继续后按确定,就会生成新的变量。结果如下。b 计算加分。同理。(括号为判断条件)c 计算综合分,同理。4.淘汰没用的数据。因为这一步需要选择 400 分以上的,排名前 7 的同学。A 淘汰 400 分以下的。并且不良记录为 0 的.

8、按下图一步一步进行。B 排序C 选择前 7 名,依旧是选择个案,但这次是第 3 个选项,基于时间或者个案。输出选择删除没选中的变量实验结果如下。2.7思考题1.排序变量有没有更方便的方法?2 输出是干什么的?项目 3:重新分组&制表3.1实验实践课时2 课时3.1实验实践目的掌握 spss 建立数据文件的基本操作(其中包括数据整理:转换转换菜单)以及运用分析分析菜单中的设定表设定表来定制表格。3.3实验实践条件单人单机,SPSS183.4实验实践背景知识简单的软件操作经验,二维表格的坐标3.5实验实践内容1 用数据 data3,将受教育程度重新分段编码:小于等于 8 年的编码为 1;9-12

9、年的编码为 2;13-16 年的编码为 3;17 年以上的编码为 4。2制表,表明不同受教育年限的各种职务的人数;不同受教育年限的各种职务的平均初始工资。性别做层变量。3.6实验实践步骤1变量重新编码单击转换菜单下的重新编码为不同变量设定输出变量名称为 edufz,点击更改,然后点击旧值和新值点击 范围,从最低到值(G):8,然后新值那里填写 1,然后点添加同理,范围从 9-12 为新值 2,点添加(如图所示)最终结果如下图,点继续,然后按确定,重新编码完成。接着修改变量属性,标准为序号,小数点默认 2 位去掉2 制表,根据要求,我们需要制 2 个表。点击 分析 设定表第一个表,在压缩视图里(

10、因为要截屏所以我在压缩视图内),edufz 为横坐标,jobcat 为纵坐标,表明不同受教育年限的各种职务的人数第二个表,在原先的 edufz 后面加上 salbegin.输出窗口双击表格可以查看层变量,负责这些表格到实验报告,本实验完成。3.7思考题1 定义那里的摘要统计量和分类与总计是什么?2 制表时该如何选择横纵坐标才能使表格达到要求又美观?项目 4:描述性统计分析4.1实验实践课时2 课时4.2实验实践目的掌握利用频数表进行数据分析4.3实验实践条件SPSSv184.4实验实践背景知识统计学知识基础4.5实验实践内容使用 data4 数据,利用频数表简单说明家庭收入(income)数据

11、的分布情况。4.6实验实践步骤由于本实验位考察题,考验同学们队数据的分组能力和分析能力,因此该教程只有指引没有具体教程。Step1:对数据进行分析,这里我们使用频率表。操作如下:1.分析描述统计频率在弹出的窗口选择统计量选择以下数值-单击确定完成。结果如下。统计量统计量家庭收入(千)N有效6400缺失0均值69.4748均值的标准误.98398中值45.0000众数25.00标准差78.71856方差6196.612偏度4.513偏度的标准误.031峰度33.877峰度的标准误.061全距1107.00极小值9.00极大值1116.00和444639.00百分位数2528.00005045.0

12、0007579.0000Step2:对频率表进行分析,确定分组条件,进行重新编组(参照实验 2),最后建立图表,分析结论。下面给出一种参考方式。因为操作简单所以不复制实验操作了。1.jtsrfz 的数值分组为,1=“=401”。2.频数分析(1)点击“统计量”按钮,弹出“统计量”子对话框选择输出的描述性统计量,包括“百分位值”选项栏中的四分位数;和“集中趋势”的全部选项,以及“离散”和“分布”的全部选项,点击“继续”确认。(2)在“频率”主对话框,点击“图表”按钮弹出“图表”子对话框,在“图表类型”选项框中选择“饼图”,点击“继续”确认。3.结论:由以下图表可以看出收入中等的中产阶层人数最多,

13、说明社会群体收入大体相当,没有明显的贫富悬殊。4.7思考题1.你的分组依据是什么?2.这个图表显示的是弄个国家的收入情况?项目 5:均值比较与假设检验5.1实验实践课时2 课时5.2实验实践目的掌握运用 SPSS 软件进行假设检验和参数估计的方法。5.3实验实践条件Spss185.4实验实践背景知识统计学假设检验相关章节5.5实验实践内容评价两个培训中心的教学质量,对两个培训中心的学员进行了一次标准化考试,考试成绩如表中数据所示,分析两个培训中心的教学质量是否有所差异,得出统计分析结果,并推断结论。5.6实验实践步骤Step 1.:打开本次实验的 sav。Step 2.:点击变量视图把 cen

14、ter 中的度量标准改成名义Step 3.:点击分析比较均值独立样本 T 检验把学员成绩为检验变量把培训中心为分组变量定义组使用指定值组 1 为“1”,组 2为“2”。继续确定Step 4.:复制输出表格组统计量组统计量培训中心N均值标准差均值的标准误学员成绩培训中心A3082.508.0031.461培训中心B3877.6610.0361.628独立样本检验独立样本检验学员成绩假设方差相等假设方差不相等方差方程的 Levene 检验F1.350Sig.249均值方程的 t 检验t2.1552.213df6665.988Sig.(双侧).035.030均值差值4.8424.842标准误差值2.

15、2462.188差分的 95%置信区间下限.357.474上限9.3279.210Step5、实验结论1方差方程的 Levene 检验中的 Sig=p=02490.05,表明接受原假设 h0,即方差齐次。我们需要使用方差相等时的数据。2T 检验 sig=p=0.035培训中心 B,且标准差培训中心 A培训中心 B,据此我们可以认为培训中心 A 教学质量优于培训中心 B5.7思考题1.本实验用到了那些统计学知识?2.为什么要把 center 的度量标准改为名义,不改为名义会出现什么后果?项目 6:相关分析6.1实验实践课时2 课时6.2实验实践目的掌握连续变量相关分析的操作方法。6.3实验实践条

16、件Spss186.4实验实践背景知识连续变量,参数分析相关知识6.5实验实践内容在数据 data6 中是 474 名职工的职务等级 jobcat、起始工资 salary、现工资 salary、受教育程度 educ、本单位工作经历 jobtime、以前工作经历 prevexp、职工编号 id。分析该公司起始工资的确定与什么因素有关以及当前工资与什么因素有关。6.6实验实践步骤Step1:打开 data6,进入变量视图,将变量名 id 的度量尺度改为名义,jobcat 的度量尺度改为序号,其他变量名 salbegin、salary、educ、jobtime、prevexp 的度量尺度改为 Scal

17、e,其余不变。Step2:选择菜单分析相关双变量,在弹出的对话框中,将待分析的 7 个变量(jobcat、salbegin、salary、educ、jobtime、prevexp、id)移入右边的变量列表框中。在相关系数选项栏中选择 Kendall 秩相关系数和 Spearman 秩相关系数,在显著性检验选项栏中选择双侧检验双侧检验,再选中标记显著性相关复选框,单击确定。Step3:单击 Paste 按钮,在语法对话框中的 id 后面加上“with salary salbegin”点击运行。Step4:复制图表说明:Current Salary为当前工资,Beginning Salary为起始

18、工资相关系数相关系数Current SalaryBeginningSalaryKendall 的 tau_bEmployment Category相关系数.530*.519*Sig.(双侧).000.000N474474Current Salary相关系数1.000.656*Sig.(双侧).000N474474Months since Hire相关系数.071*-.046Sig.(双侧).022.146N474474Beginning Salary相关系数.656*1.000Sig.(双侧).000.N474474Previous Experience(months)相关系数-.013.13

19、3*Sig.(双侧).677.000N474474Educational Level(years)相关系数.554*.568*Sig.(双侧).000.000N474474Employee Code相关系数-.077*.039Sig.(双侧).012.218N473473Spearman 的 rhoEmployment Category相关系数.645*.625*Sig.(双侧).000.000N474474Current Salary相关系数1.000.826*Sig.(双侧).000N474474Months since Hire相关系数.105*-.063Sig.(双侧).023.168

20、N474474Beginning Salary相关系数.826*1.000Sig.(双侧).000.N474474Previous Experience(months)相关系数-.023.186*Sig.(双侧).625.000N474474Educational Level(years)相关系数.688*.688*Sig.(双侧).000.000N474474Employee Code相关系数-.114*.054Sig.(双侧).013.245N473473*.在置信度(双测)为 0.01 时,相关性是显著的。*.在置信度(双测)为 0.05 时,相关性是显著的。Step5:得出结论:(以下

21、为参考)上表给出了 Kendall 秩相关系数和 Spearman 秩相关系数两种非参数相关分析结果。从表中可以看出:1.职务等级、当前工资和受教育程度 3 个指标与起始工资之间的相关系数都在 0.5 以上,对应的 P 值都接近于 0,表示这 3 个指标具有较强的正相关关系;而本单位工作经历、以前工作经历、职工编号与起始工资之间的相关性较弱。2.职务等级、起始工资和受教育程度 3 个指标与当前工资之间的相关系数都在 0.5 以上,对应的 P 值都接近于 0,表示这 3 个指标具有较强的正相关关系;而本单位工作经历、以前工作经历、职工编号与当前工资之间的相关性较弱。因此,该公司的起始工资与职务等

22、级、当前工资和受教育程度这 3 个因素有关,其中当前工资的影响力最大;而当前工资与职务等级、起始工资和受教育程度这 3 个因素有关,其中起始工资的影响力最大。6.7思考题这章不会写项目 7:单因素方差分析7.1实验实践课时2 课时7.2实验实践目的掌握运用 SPSS 软件进行假设检验和参数估计的方法。7.3实验实践条件Spss187.4实验实践背景知识统计学假设检验和参数估计相关知识7.5实验实践内容在显著水平=0.05 下,检验 4 种行业服务质量等级的总体均值是否差异显著,得出结论7.6实验实践步骤Step1.:打开 data7.sav,进入变量视图把 trade 中的度量标准改成名义St

23、ep2.:点击分析比较均值单因素 anova把 score 为因变量把 trade 为因子;选项方差同质性检验,勾选;两两比较,勾选 LSD,tamhanes t2,置信度为 0.05.,分别按继续,最后确定输出表格。Step 3.:复制输出表格方差齐性检验方差齐性检验scoresLevene 统计量df1df2显著性1.493319.249单因素方差分析单因素方差分析scores平方和df均方F显著性组间731.1793243.72611.644.000组内397.6901920.931总数1128.87022多重比较多重比较因变量:scores(I)trade(J)trade均值差(I-J

24、)标准误显著性95%置信区间下限上限LSDarewaysretailing-4.023812.54532.130-9.35121.3036hotel-13.45714*2.67887.000-19.0641-7.8502auto1.942862.67887.477-3.66417.5498retailingareways4.023812.54532.130-1.30369.3512hotel-9.43333*2.77033.003-15.2317-3.6350auto5.96667*2.77033.044.168311.7650hotelareways13.45714*2.67887.0007

25、.850219.0641retailing9.43333*2.77033.0033.635015.2317auto15.40000*2.89352.0009.343821.4562autoareways-1.942862.67887.477-7.54983.6641retailing-5.96667*2.77033.044-11.7650-.1683hotel-15.40000*2.89352.000-21.4562-9.3438Tamhanearewaysretailing-4.023812.76554.683-12.89304.8454hotel-13.45714*2.88913.007-

26、23.1227-3.7916auto1.942862.28628.960-5.60159.4873retailingareways4.023812.76554.683-4.845412.8930hotel-9.433332.93617.065-19.3698.5031auto5.966672.34544.188-2.125314.0586hotelareways13.45714*2.88913.0073.791623.1227retailing9.433332.93617.065-.503119.3698auto15.40000*2.48998.0046.068724.7313autoareways-1.942862.28628.960-9.48735.6015retailing-5.966672.34544.188-14.05862.1253hotel-15.40000*2.48998.004-24.7313-6.0687*.均值差的显著性水平为 0.05。Step 3.:得出结论。分析过程和得出结论与实验 5 一样,故这里不给出,请同学们独立完成实验结论。7.7思考题1.课下了解 LSD,tamhanes t2,这 2 种检验方法。2.解释你的结论如何得出的?

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > 工作总结

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁