《实验四指导书运用STATISTICA和SPSS软件进行样本方差的检验和讲解564.pdf》由会员分享,可在线阅读,更多相关《实验四指导书运用STATISTICA和SPSS软件进行样本方差的检验和讲解564.pdf(20页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、数理统计 B 实验指导书 理学院实验中心 数学专业实验室编写 实验四 运用 STATISTICA 和 SPSS 软件进行样本方差的检验和分析【实验类型】(综合性)【实验学时】2 学时【实验目的】通过上机操作掌握在 STATISTICA 和 SPSS 软件中的样本方差的卡方检验和 F 检验,熟悉软件数据的引入和分析,熟悉相关选项的操作,并能正确解释软件处理的结果。【实验内容】1、利用 STATISTICA 和 SPSS 软件完成对单样本方差的卡方检验,并解释软件处理的结果。2、利用 STATISTICA 和 SPSS 软件完成对双样本方差的 F 检验,并解释软件处理的结果。3、利用 STATIS
2、TICA 和 SPSS 软件完成单因子方差分析,并解释软件处理的结果。数据分析:1、抽样样本量确定以后,对单样本方差的卡方检验,并解释软件处理的结果。2、利用得到的抽样,对样本方差的 F 检验,估计量的方差的分析,并第 1 页 解释软件处理的结果。3、确定因子,完成单因子方差分析,并解释软件处理的结果。【实验报告要求】1.写出实验步骤;2.附上数据处理结果。SPSS 操作步骤:一、打开 EXCEL 文件:可以选择现有的数据源,也可以选择自己的文件,但一定要注意打开文件的类型的选择,要选择打开 EXCEL 文件的工作区,和范围;打开的文件如下图 二、SPSS 软件对单样本均值的卡方检验,并对结果
3、做分析。简单的统计量分析,在分析选项中 1、首先选择“分析”“非参数检验”“旧对话框”“卡方”,打开“卡方”对话框。选出要检验的变量到“检验变量”中,可以选一个,也可能选多个,多个被选中,则会每个变量都出一个结果。点“选项”出现新对话框,是对假设检验的统计量和缺失值的设置;点“精确检验”对话框用于选择计算显著性水平sig.值的几种方法,通常系统默认的渐进方法。点“继续”返回后,点“粘贴”可以进入“语法对话框”得到如下结果:可以对结果进行多次编程。无需改动,就返回,点“确定”得到结果。检验统计量 对照班前测总分卡方34.261adf43第 1 页 渐近显著性.827a.44 个单元(100.0%
4、)具有小于 5 的期望频率。单元最小期望频率为 2.1。三、SPSS 软件对对样本方差的 F 检验,估计量的方差的分析。简单的统计量分析,在分析选项中 2、首先选择“分析”“比较均值”“单因素 ANOVA”,打开“单因素 ANOVA”对话框。选出要检验的变量到“因变量列表”中,可以选一个,也可能选多个,多个被选中,则会每个变量都出一个结果;“因子”中,只可以选一个,则会每个变量按分好的组都出一个结果;单击“对比”按钮,然后从打开的对比对话框中的“度”下拉列表框选择“线性”,选项,“继续”后返回主对话框,再单击“两两比较”按钮,然后从打开的对比对话框中选择“LSD”,选项,“继续”后返回,再单击
5、“选项”按钮,然后选择“描述性”和“均值图”,选项,“继续”后返回,最后确定出结果。点“继续”返回后,点“粘贴”可以进入“语法对话框”得到如下结果:可以对结果进行多次编程。无需改动,就返回,点“确定”得到结果。描述对照班前测总分第 2 页 N均值标准差标准误均值的 95%置信区间极小值极大值下限上限1482971.8114.843.21471.3972.23431202143667.0610.598.28066.5167.614881总数626570.7214.125.17870.3771.0743120ANOVA对照班前测总分 平方和df均方F显著性组间(组合)24959.8511 2495
6、9.851127.625.000线性项未加权的24959.8511 24959.851127.625.000加权的24959.8511 24959.851127.625.000组内1224864.5966263 195.572 总数1249824.4466264 重新做因子有三个的类别,有三班,分别 31 班 32 班 33 班,描述从56到70 N均值标准差标准误均值的 95%置信区间极小值极大值下限上限314524.181.992.29723.5824.782030324523.912.372.35423.2024.622030334525.021.889.28224.4525.59223
7、0第 3 页 描述从56到70 N均值标准差标准误均值的 95%置信区间极小值极大值下限上限314524.181.992.29723.5824.782030324523.912.372.35423.2024.622030334525.021.889.28224.4525.592230总数13524.372.133.18424.0124.732030ANOVA从56到70 平方和df均方F显著性组间(组合)30.281215.1413.451.035线性项对比16.044116.0443.657.058偏差14.237114.2373.245.074组内579.2001324.388 总数609
8、.481134 多重比较从56到70LSD(I)班级(J)班级均值差(I-J)标准误显著性95%置信区间下限上限3132.267.442.547-.611.1433-.844.442.058-1.72.033231-.267.442.547-1.14.6133-1.111*.442.013-1.98-.24第 4 页 3331.844.442.058-.031.72321.111*.442.013.241.98*.均值差的显著性水平为 0.05。由多重比较,可以得到31与33班的显著性0.058,31与32班的显著性是0.547,说明31与32班的差异要大一点,均值,是 32 班最小,33 班
9、最大 四、SPSS 软件对对样本相关性的分析。1、简单的统计量分析,在分析选项中 2、首先选择“分析”“相关”“双变量”,打开“双变量相关”对话框。选两个变量和多个变量,做“PEARSON”相关系数的相关性分析,不清楚变量之间是正相关还是负相关,就选双侧检验,如果知道正负,就选“单侧检验”。描述性统计量 均值标准差N对照班前测总分68.1013.43392对照班后测总分67.5913.08792相关性 对照班前测总分对照班后测总分第 5 页 对照班前测总分Pearson 相关性1.996*显著性(双侧).000平方与叉积的和16420.12015928.717协方差180.441175.041
10、N9292对照班后测总分Pearson 相关性.996*1显著性(双侧).000 平方与叉积的和15928.71715586.304协方差175.041171.278N9292*.在.01 水平(双侧)上显著相关。相关系数为1和0.996,说明相关性非常强 如果多个变量做相关性分析,现选四个变量得如下结果 描述性统计量 均值标准差N第 6 页 对照班前测总分68.1013.43392对照班后测总分67.5913.08792实验班前测总分64.9515.03678实验班后测总分97.8311.74878相关性 对照班前测总分对照班后测总分实验班前测总分实验班后测总分对照班前测总分Pearson
11、相关性1.996*.868*.786*显著性(双侧).000.000.000第 7 页 平方与叉积的和16420.12015928.71712850.0779089.000协方差180.441175.041166.884118.039N92927878对照班后测总分Pearson 相关性.996*1.865*.780*显著性(双侧).000.000.000平方与叉积的和15928.71715586.30412414.8728754.833协方差175.041171.278161.232113.699N92927878实验班前测总分Pearson 相关性.868*.865*1.896*显著性(双
12、侧).000.000.000第 8 页 平方与叉积的和12850.07712414.87217407.79512183.333协方差166.884161.232226.075158.225N78787878实验班后测总分Pearson 相关性.786*.780*.896*1显著性(双侧).000.000.000 平方与叉积的和9089.0008754.83312183.33310626.833协方差118.039113.699158.225138.011N78787878*.在.01 水平(双侧)上显著相关。由上面的结果,可以得到,对照班前测总分和对照班后测总分相关系数是0.996,相关性最强
13、,实验班前测总分与实验班后测总分的相关系数是0.896,比其它的又大一点,所以它俩之间相关性大一点。3、首先选择“分析”“相关”“偏相关”,打开“偏相关”对话第 9 页 框。偏相一般是研究多个变量之间的相关关系是的,如 研究农作物产量与雨量与气温之间的偏相关,高温多雨均有利于产量,而高温与雨量是负相关,高温则一定少雨,所以高温与产量不是简单的相关,而是固定雨量,确定高温与产量的相关性,就是偏相关,控制一个变量时,叫一阶偏相关分析,要控制二个变量时,叫二阶偏相关分析。DXDYYXCOV),(12简单相关系数“变量”输入进行偏相关分析的变量,可以两个,也可以多个,则给出两两相关分析,“控制”输入控
14、制变量,需要控制的变量。点“选项”对话框,选中统计量,见右上图 点“继续”后,返回“确定”按钮,执行结果。相关性控制变量对照班前测总分实验班前测总分实验班后测总分对照班前测总分相关性1.000.597显著性(双侧).000df075实验班前测总分相关性.5971.000显著性(双侧).000.df750描述性统计量第 10 页 均值标准差N对照班前测总分70.7712.78678实验班前测总分64.9515.03678实验班后测总分97.8311.74878相关性控制变量对照班前测总分实验班前测总分实验班后测总分-无-a对照班前测总分相关性1.000.868.786显著性(双侧).000.00
15、0df07676实验班前测总分相关性.8681.000.896显著性(双侧).000.000df76076实验班后测总分相关性.786.8961.000显著性(双侧).000.000.df76760实验班后测总分对照班前测总分相关性1.000.597 显著性(双侧).000 df075 实验班相关性.5971.000 第 11 页 前测总分显著性(双侧).000.df750 a.单元格包含零阶(Pearson)相关。4、首先选择“分析”“相关”“距离”,打开“距离”对话框。在距离分析过程中,主要利用变量之间的相似性测度与不相似性测度,“不相似性测度”主要有欧氏距离,平方欧氏距离,契比雪夫距离,
16、BLOCK 距离,等,“相似性测度”PEARSON 相关系数和夹角余弦距离,对于二值变量的相似性测度,也有简单匹配系数,等 在“计算距离”中选中“变量间”,在“度量标准”中选“相似性”点“确定”结果如下:案例处理摘要案例有效缺失合计N百分比N百分比N百分比78 84.8%14 15.2%92 100.0%近似矩阵 值向量间的相关性 对照班前测总分对照班后测总分实验班前测总分实验班后测总分对照班前测总分1.000.995.868.786对照班后测总分.9951.000.865.780第 12 页 实验班前测总分.868.8651.000.896实验班后测总分.786.780.8961.000这是
17、一个相似性矩阵相似矩阵也就是PEARSON相关系数矩阵,从上表可以得到,对照班前测总分与对照班后测总分的相关系数是0.995,相关性最大。实验班前测总分与实验班后测总分相关系数是0.896,相关性是最大。五、SPSS软件作单因子方差分析的分析。单因子方差分析有两种,第一种是完全随机设计方差分析;另一种是随机单位组设计方差分析;第一种:1、打开 EXCEL 文件,2、简单的统计量分析,在分析选项中 首先选择“分析”“比较均值”“单变量 ANOVE”,打开“单因素方差分析”对话框。其中“因变量列表”,是选择要选择的变量,对其进行方差分析 其中“因子”,是对选择的变量由该因子分类,进行方差分析 另一
18、种:1、打开 EXCEL 文件,2、简单的统计量分析,在分析选项中 首先选择“分析”“一般线性模型”“单变量”,打开“单变量”第 13 页 对话框。其中“固定因子”就是需要分析时考虑的因子,可以是一个也可以是两个多个,其中“因变量”就是需要分析的变量,其中“选项”就是分析出的选项,有对话框如下:其中“模型”选定模型类型 得结果如下:描述性统计量因变量:总保费汽车类别均值标准 偏差N瑞纳 2019款 1.4L 手动顶级型TOP2822.4557402.3517428瑞纳 2019款 1.4L 手动智能型GLS2461.4957402.3517428瑞纳 2019款 1.4L 自动领先型GLX28
19、73.6557402.3517428第 14 页 瑞纳 2019款 1.4L 自动智能型GLS2796.8557402.3517428总计2738.6157429.08297112主体间效应的检验因变量:总保费源III 型平方和df均方FSig.偏 Eta 方校正模型2952665.498a3 984221.8336.080.001.144截距8.400E81 8.400E85188.818.000.980汽车类别2952665.4983 984221.8336.080.001.144误差17483787.857108 161886.925 总计8.604E8112 校正的总计20436453
20、.355111 第 15 页 描述性统计量因变量:总保费汽车类别均值标准 偏差N瑞纳 2019款 1.4L 手动顶级型TOP2822.4557402.3517428瑞纳 2019款 1.4L 手动智能型GLS2461.4957402.3517428瑞纳 2019款 1.4L 自动领先型GLX2873.6557402.3517428瑞纳 2019款 1.4L 自动智能型GLS2796.8557402.3517428a.R 方=.144(调整 R 方=.121)参数估计因变量:总保费参数B标准 误差tSig.95%置信区间偏 Eta 方下限上限第 16 页 截距2796.85676.03736.7
21、83.0002646.1372947.575.926汽车类别=瑞纳 2019款 1.4L 手动顶级型TOP25.600107.533.238.812-187.549238.749.001汽车类别=瑞纳 2019款 1.4L 手动智能型GLS-335.360107.533-3.119.002-548.509-122.211.083汽车类别=瑞纳 2019款 1.4L 自动领先型GLX76.800107.533.714.477-136.349289.949.005汽车类别=瑞纳 2019款 1.4L 自动智能型GLS0a.a.此参数为冗余参数,将被设为零。STATISTICA 操作步骤:、打开 E
22、XCEL 文件:做样本卡方检验,打开之后,点主菜单中的“统计”后选“非参统计”打开对话框,第 17 页 选择观测次数与期望次数的卡方检验后,双击“观测次数与期望次数的卡方检验”出现对话框,首先选定变量,选定“变量”,可以选一个变量,按住 CTRL 也可以选多个变量,点“确定”后返回。点“”后得出结论,二、打开 EXCEL 文件:做单因子方差分析,打开之后,点主菜单中的“统计”后选“方差分析”打开对话框,选择一因子方差分析后,双击“一因子方差分析”出现对话框,首先选定变量,选定“变量”,可以选一个变量,按住 CTRL 也可以选多个变量,点“确定”后返回。选择“反应变量”,可以选一个变量,按住 CTRL 也可以选多个变量;“类别预测变量”是需要预测的变量,点确定后出新对话框。点“”后得出效用结论上面右侧的图,点确定得出图形结论。