spss实验报告.doc-淘文阁

资源描述

《spss实验报告.doc》由会员分享，可在线阅读，更多相关《spss实验报告.doc（14页珍藏版）》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、.*统计分析与SPSS的应用学院（系）专业名称班级姓名学号实习地点起止时间2015年 5月至 2015 年 7月实验内容： 1统计数据的收集与预处理1.1数据文件的编辑1.1.1数据文件的合并数据文件的合并是把外部数据与当前数据合并成一个新的数据文件，SPSS提供两种形式的合并：一是横向合并，指从外部数据文件中增加变量到当前数据文件中；二是纵向合并，指从外部数据文件增加观测数据到当前文件中。横向合并即增加变量，而增加变量有两种方式：一是从外部数据文件中获取变量数据，加入当前数据文件中；二是按关键变量合并，要求两个数据文件有一个共同的关键变量，而且两个数据文件的关键变量中还有一定数量相同值的观

2、测值。1.1.2数据文件的拆分拆分并不是要把数据文件分成几个，而是根据实际情况，根据变量对数据进行分组，为以后的分组统计提供便利。例2-2实验步骤：打开data2-2.sav点击菜单栏的数据，拆分文件，弹出“分割文件”按照产品类型拆分数据，选择“比较组”，激活“分组方式”栏。选中“产品”变量移入其中，单击“确定”按钮结束。点击菜单“分析描述性统计描述”，弹出“描述性”对话框，选择变量“金额”，“数量”进行分析，单击“选择”按钮设置要计算的统计量，统计金额和数量的和，设置好后单击确定按钮，得到表1所示的统计量：表1描述统计量产品N极小值极大值和均值标准差彩电数量4125014436.0016.5

3、73金额438400160000460800115200.0053033.826有效的 N （列表状态）4空调数量13333.00.金额19600960096009600.00.有效的 N （列表状态）1热水器数量211243517.509.192金额225300552008050040250.0021142.493有效的 N （列表状态）2微波炉数量21242512.5016.263金额22100504005250026250.0034153.258有效的 N （列表状态）2洗衣机数量25485326.5030.406金额21100010560011660058300.0066892.302

4、有效的 N （列表状态）2从表1可以得出彩电、空调、热水器、微波炉、洗衣机的数量、金额的极大值、极小值、和、均值标准差这四个描述性统计量是多少。1.1.3数据的加权SPSS的观察量加权功能是在数据文件中选择一个变量，这个变量力的值是相应的观测量出现的次数，这个变量叫做权变量，经过加权的数据文件叫做加权文件。例2-3实验步骤：打开data2-3.sav选择数据，加权个案选择“加权个案”，激活“频率变量”矩形框，把“工人数”变量移入框中。选择“分析”，描述统计描述，进行产品数量总和的统计，统计结果如表2所示：可以看出产品数量的极大值、极小值、和、均值、标准差这四个描述性统计量。表2描述统计量N极小

5、值极大值和均值标准差产品数量1182030285424.193.883有效的 N （列表状态）1181.2SPSS数据加工1.2.1变量的计算例2-4实验步骤：打开data2-4sav选择“转换”，计算变量，弹出“计算变量”窗口在“目标变量”框中输入目标变量名“总分”从左边的变量列表窗口中选择用于计算的变量并加入“数学表达式”框中，并乘以相应的系数即可。图1变量计算后的结果图1是变量计算后的结果：根据计算公式：总分=实验准备*0.15+讲解示范*0.15+实验指导*0.2+教学方法*0.15+语言文字*0.05+教学手段*0.1+课堂管理*0.2.，可以得出教师的综合评价分。2图表的创建与编辑

6、2.1使用图表构建程序创建使用图表构建程序创建图表，是SPSS现在推崇的主要操作方式，该方式使用预览模式通过图库或基本元素设计图表，让用户所见所得，可以提高创建图形的效率，减少一些不可预见的错误。例3-1实验步骤：打开data3-1.sav选择菜单：“图形”，图表构建程序，弹出“图表构建程序”对话框选择“库”选项卡，点击“条（B）”中第二项“群集条形图”图标把年份拖入“是否为X轴”虚线框中作为条形图的X轴；把指标值“是否为Y轴”虚线框，作为条形图的Y轴；把指标拖入“X轴上的分群：设置颜色”虚线框中，作为复合分类变量选择标题/脚注，点击标题1，设置标题“第一、二、三产业各年产值比较图”点击确定按

7、钮。得到如图2：可以从图中得到信息：自1978年以来，这三种产业的产值都在增加；每年第二产业的产值都是最高，第三产业次之，第一产业的产值最少。图2第一、二、三产业各年产值比较图2.2使用图形画板模板选择程序创建打开data3-1.sav选择菜单：图形，点击“图形画板模板选择程序”在“基本”选项卡中，同时选中年份和指标值进行可视化表示，在摘要中选择“均值”在“详细”选项卡中，X轴设置为“年份”，Y轴设置为“指标值”，面板横跨中选择“指标”单击确定按钮，如图3：图3可视化输出图形结果2.3使用旧对话框创建和前面两种创建图形方式相比，旧对话框方式缺少灵活性和直观性，但可以对生成的图形进一步编辑。例3

8、-2实验步骤：打开data3-2.sav选择“图形”，旧对话框，线图中的多线线图单击“定义”，在弹出的对话框中，指标值放入“变量（V）”中，“年份”放入“类别轴（X），“指标分类”放入“定义线的方式（D）确定，得到图4：图4结果图形从图4可以得到如下信息：从1990年开始，特快专递、移动电话业务呈逐年上升的趋势，特别是特快专递到2006-2007年期间，业务增长迅猛。固定电话业务在1990-2006期间呈上升趋势，但2006-2007年期间有下降趋势。3描述性统计分析描述集中趋势的统计量有均值、中位数、众数、总和、百分位数；描述离散程度的统计量有样本方差、样本标准差、均值标准误差、极差；描述总

9、体分布形态的统计量有偏度、峰度。3.1频率分析例4-1实验步骤：打开data4-1.sav选择菜单，“分析-描述性统计-频率在弹出的“频率”对话框中，把收入、教育放入“变量（V）”框中点击统计量，在百分位值中选择百分位数，在百分位数中添加30、60、90；集中趋势中选择“众数”统计量，点击继续点击图表，选中直方图，同时选中“在直方图上显示正太曲线”，点击继续确定得到以下图表：表3统计量收入教育N有效836835缺失01众数35百分位数303.004.00604.005.00907.005.00表4变量“收入”的频率分布标表频率百分比有效百分比累积百分比有效02.2.2.218710.410.4

10、10.6215218.218.228.8315718.818.847.6413716.416.464.058810.510.574.568510.210.284.77526.26.290.98273.23.294.1991.11.195.21081.01.096.211323.83.8100.0合计836100.0100.0表5变量“教育”频率分布表频率百分比有效百分比累积百分比有效181.01.01.02394.74.75.6311413.613.719.3416519.719.839.0545654.554.693.76536.36.3100.0合计83599.9100.0缺失系统1.1合

11、计836100.0图5变量“收入”的直方图图6变量“教育”的直方图表4变量“收入”的频率分布标表可以看出受访者家庭收入在“2000-2999”的人最多。从图5和图6，受访者教育程度同正态分布相比左偏，受访者家庭收入的分布右偏，都不是明显的正态分布。3.2描述性分析描述性分析主要是用于计算并输出变量的各类描述性统计量，和频率分析相比，没有图形功能，也不能生成频率表，但它可以将原始数据标准化，以便后续分析时应用。例4-2实验步骤：打开data4-2.sav依次点击分析、描述统计、描述，打开“描述性”主对话框把身高作为变量移入候选变量框中，在“选项”子对话框中选择均值、标准差、最大值、最小值、峰度、

12、偏度这几个描述性性统计量确定得到表6表6描述统计量N极小值极大值均值标准差偏度峰度统计量统计量统计量统计量统计量统计量标准误统计量标准误体重96133018.233.0071.163.2461.849.488有效的 N （列表状态）96表6包括了身高的个数、极值、均值、标准差、偏度和峰度信息，输出的统计量中，方差和标准差越小越好，说明该组数据趋于稳定。4参数估计与假设检验4.1单样本T检验单样本T检验利用来自某总体的样本数据，推断该总体的均值与指定的检验值之间是否存在显著性差异，它是对总体均值的假设检验。例5-2的实验步骤：打开data5-1.sve选择菜单“分析比较均值单样本T检验（S）”，

13、打开 “单样本T检验” 对话框，将变量“weight”移入”检验变量”列表框,并输入检验值500打开“单样本T检验：选项”对话框 ,设置置信区间为95%(缺省为95%)确定。运行结果如表7和表8所示：表7单个样本统计量StatisticBootstrapa偏差标准误差95% 置信区间下限上限weightN10均值500.8000-.08101.6784497.4533504.1467标准差5.39135-.38267.974862.998156.95100均值的标准误1.70489表8单个样本检验检验值 = 500 tdfSig.(双侧)均值差值差分的 95% 置信区间下限上限weight.

14、4699.650.80000-3.05674.6567表7给出了单样本T检验的描述性统计量，包括样本数（N）、均值、标准差、均值的标准误。表8：当置信水平为95%，显著性水平为0.05，从上表中可以看出，双尾检测概率P值为0.650，大于0.05，故原假设成立，也就是说，抽样袋装食盐的质量与500克无显著性差异，有理由相信生产线工作状态正常。4.2独立样本T检验单样本T检验是检验样本均值和总体均值是否有显著性差异，而两独立样本T检验的目的是利用来自某两个总体的独立样本，推断两个总体的均值是否存在显著差异。例5-3实验步骤：打开data5-2.sav选择菜单 “选择比较均值独立样本T检验”，打开

15、“独立样本T检验”对话框，将“产量” 作为要进行T检验的变量，将“品种”字段作为分组变量，定义分组变量的两个分组分别为“a”和“b”打开“独立样本T检验：选项”对话框，具体选项内容及设置与单样本T检验相同确定得到表9和表10：表9组统计量玉米品种N均值标准差均值的标准误单位面积产量品种A881.250011.804964.17368品种B875.750010.024973.54436表10独立样本检验方差方程的 Levene 检验均值方程的 t 检验FSig.tdfSig.(双侧)均值差值标准误差值差分的 95% 置信区间下限上限单位面积产量假设方差相等.104.7521.00414.3325

16、.500005.47560-6.2439817.24398假设方差不相等1.00413.642.3335.500005.47560-6.2729717.27297根据表10“方差方程的 Levene 检验”中的sig.为0.752，远大于设定的显著性水平0.05，故本例两组数据方差相等。在方差相等的情况下，独立样本T检验的结果应该看上表中的“假设方差相等”一行，第5列为相应的双尾检测概率（Sig.（双侧）为0.332，在显著性水平为0.05的情况下，T统计量的概率p值大于0.05，故不应拒绝零假设,，即认为两样本的均值是相等的，在本例中，不能认为两种玉米品种的产量有显著性差异。 5方差分析5.

17、1单因素方差分析单因素方差分析检验由单一因素影响的一个（或几个相互独立的）因变量，由因素各水平分组的均值之间的差异，是否具有统计意义，或者说它们是否来源来同一总体。例6-1实验步骤：、方差相等的齐性检验：选择菜单“分析均值比较单因素ANOVA”，打开“单因素方差分析”对话框把猪重作为因变量，饲料品种作为控制变量点击选项，弹出选项对话框，选择“方差同质性检验”确定得到表和表。多重比较分析、：单击“两两比较（H）按钮，弹出两两比较对话框，选择LSD最小显著性差异确定得到表表11方差齐性检验猪重Levene 统计量df1df2显著性.024315.995方差齐性检验的H0假设是：方差相等。从表11可

18、看出相伴根据Sig.=0.995（0.05）说明应该接受H0假设（即方差相等）。故下面就用方差相等的检验方法。表12ANOVA猪重平方和df均方F显著性组间20538.69836846.233157.467.000组内652.1591543.477总数21190.85818表12是几种饲料方差分析的结果，组间平方和为20538.698，自由度（df）为3，均方为6846.233；组内平方和为652.159，自由度为15，均方为43.477；F统计量为157.467。由于组间比较的相伴概率Sig.（p值）=0.0000.05，因此认为各组的方差具有齐性。表15是检验控制变量与协变量是否具有交互

19、作用，从其中可看出group与entrance的交互作用项Sig.=0.7840.05，因此认为它们之间没有交互作用。可以看出入学成绩的影响是不显著的，而教学方法的影响是显著的。6相关分析6.1两变量相关分析二元变量的相关分析是指通过计算变量间两两相关的相关系数，对两个或两个以上变量之间两两相关的程度进行分析。例7-1实验步骤：选择菜单“分析相关双变量”，打开“双变量相关”对话框将“father”和“son”移入变量框中，选择双侧检验，相关系数选择“person”在选项对话框中选择均值和标准差、叉积偏差和协方差确定，得到表17：表17相关性父亲身高儿子身高父亲身高Pearson 相关性1.7

20、03*显著性（双侧）.011平方与叉积的和84.66740.333协方差7.6973.667N1212儿子身高Pearson 相关性.703*1显著性（双侧）.011平方与叉积的和40.33338.917协方差3.6673.538N1212*. 在 0.05 水平（双侧）上显著相关。从表17中可看出，相关系数为0.7030，说明呈正相关，而相伴概率值Sig.=0.0050.05，因此应拒绝零假设（H0:两变量之间不具相关性），即说明儿子身高是受父亲身高显著性正影响的。6.2偏相关分析偏相关分析的任务就是在研究两个变量之间的线性相关关系时控制可能对其产生影响的变量，这种相关系数称为偏相关系数。例

21、7-3实验步骤：选择菜单“分析-相关-双变量”，打开“偏相关”对话框把 “hgrow”和“temp”作为分析变量，“rain”、“hsun”、“humi”设为控制变量确定，得到表18：表18相关性控制变量生长量月平均气温月降雨量 & 月平均日照时数 & 月平均湿度生长量相关性1.000.977显著性（双侧）.000df07月平均气温相关性.9771.000显著性（双侧）.000.df70从表18可以看出，月降雨量、月平均日照时数和月平均湿度为控制变量，生长量与月平均气温关系密切，偏相关系数为0.977，双尾检测的相伴概率为0.000（表示趋近于0的正数），明显小于显著性水平0.05。故应拒

22、绝原假设，说明中山柏的生长量与气温间存在显著的相关性。7回归分析7.1一元线性回归分析线性回归假设因变量与自变量之间为线性关系，用一定的线性回归模型来拟合因变量和自变量的数据，并通过确定模型参数来得到回归方程。根据自变量的多少，线性回归可有不同的划分。当自变量只有一个时，称为一元线性回归，当自变量有多个时，称为多元线性回归。例8-1实验步骤：作散点图，观察两个变量的相关性：依次选择菜单“图形旧对话框散点/点状简单分布”，并将“国内生产总值”作为x轴，“财政收入”作为y轴，得到图。选择菜单“分析回归线性”，打开“线性回归”对话框，将变量“财政收入”作为因变量，“国内生产总值”作为自变量。打开“

23、统计量”对话框，选上“估计”和“模型拟合度”。单击“绘制（T）”按钮，打开“线性回归：图”对话框，选用DEPENDENT作为y轴，*ZPRED为x轴作图。并且选择“直方图”和“正态概率图” 作相应的保存选项设置，如预测值、残差和距离等。图7表19方差分析表模型平方和df均方FSig.1回归1.557E911.557E9592.250.000a残差34187286.770132629791.290总计1.592E914a. 预测变量: (常量), 国内生产总值。b. 因变量: 财政收入表20回归系数表模型非标准化系数标准系数tSig.B标准误差试用版1(常量)-4993.281919.356-

24、5.431.000国内生产总值.197.008.98924.336.000从表19中可以看出，F统计量的观测值为592.25，显著性概率为0.000，即检验假设“H0：回归系数B = 0”成立的概率为0.000，从而应拒绝原假设，说明因变量和自变量的线性关系是非常显著的，可建立线性模型。从表20中可看出，回归模型的常数项为-4993.281，自变量“国内生产总值”的回归系数为0.197。因此，可以得出回归方程：财政收入=-4993.281 + 0.197 *国内生产总值。回归系数的显著性水平为0.000，明显小于0.05，故应拒绝T检验的原假设，这也说明了回归系数的显著性，说明建立线性模型是恰当的。实验体会：这几周对SPSS统计软件的学习，使我更好的掌握了统计学的知识。SPSS统计软件为统计数据处理，图表的创建与编辑、描述性统计分析、参数估计与假设检验、方差分析、相关分析和回归分析等带来了极大的方便，相对与EXCEL对数据的处理功能。操作上更加简便，也通俗易懂。这段时间的学习，让我对于学习态度有很大的改变。当遇到繁琐的问题，老师总是不厌烦给我们重新讲统计学的知识，在EXCEL为我们演示计算的每个步骤。我们缺少的就是这种耐心和严谨的治学态度，这点值得我们去学习。还有遇到不懂的问题，主动去书本上寻找知识，做到查漏补缺。

展开阅读全文