最新Spss考试基本要求及大纲分析.doc

上传人:1595****071 文档编号:47522588 上传时间:2022-10-02 格式:DOC 页数:57 大小:1.73MB
返回 下载 相关 举报
最新Spss考试基本要求及大纲分析.doc_第1页
第1页 / 共57页
最新Spss考试基本要求及大纲分析.doc_第2页
第2页 / 共57页
点击查看更多>>
资源描述

《最新Spss考试基本要求及大纲分析.doc》由会员分享,可在线阅读,更多相关《最新Spss考试基本要求及大纲分析.doc(57页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、Four short words sum up what has lifted most successful individuals above the crowd: a little bit more.-author-dateSpss考试基本要求及大纲分析Spss-C-testSpss 考试基本要求及大纲分析(仅供参考)基本要求:1、熟练2、知其然亦知其所以然3、从中随机选取2-3或4个操作题4、操作50分+解释50分5、上机独立操作第2章 数据文件的建立及整理1、以下操作在date下完成:sort cases:按照某个分组变量排列数据,分类整理,有升序和降序排列之分。Merge file

2、s add cases:插入行数据,增加个案。 add variables:插入列数据,增加变量。2、split file:DataSplit File (文件拆分) 命令,打开Split File对话框。3、select cases:DataSelect Cases (选择个案)命令,打开Select Cases对话框。执行后,会产生一个“$”的变量,凡被选中的满足条件的个案,该变量对应的值为1(其值标签为Selected),否则为0 (值标签为Not Selected),并在个案序号列上将未选中的划上斜线“”作为标记。未选中的个案将在接着进行的统计分析中暂时被关闭。按照设置的选择条件,选中

3、个案。点击if condition is satisfied选择性别xb,点击下方的表达式,让它=1.ok运行。系统将自动产生一个名为“filter_$”的变量,凡被选中的满足条件的个案,该变量对应的值为1(其值标签为Selected),否则为0 (值标签为Not Selected),并在个案序号列上将未选中的划上斜线“”作为标记。未选中的个案将在接着进行的统计分析中暂时被关闭。按照设置的选择条件,选中个案。4、weight cases:DataWeight cases (个案加权)命令,打开Weight cases 对话框。对话框中单选项Do not weight cases (不对个案加权

4、)为系统默认选项;第二个单选项为Weight cases by (对个案加权),选择此项时激活Frequency variable (频数) 矩形框,从源变量列表中选择一个加权变量移入此框中,单击OK,该数据文件的权变量便定义好了。 需要指出,一旦为数据文件定义了权变量,则称这个文件为加权数据文件,其中权变量的信息将一直有效,除非改选用别的变量作为权变量,或者关闭它。此外,如果权变量的值中有0、负数或缺失值,它便不能在分析中应用。 5、调查表编码录入 我们打开spss。然后切换到变量定义窗口,单击数据窗口下面的Variables ew (变量视图)选项卡,出现定义变量窗口。A1、您的性别:A.

5、男B.女点击value栏右侧的豆腐块按钮,出现value label,对话框。在第一个框里输入1.下面的长一点的框里输入男。点击add。然后,输入2,女,add,最后ok。结果就是这样。第3章 变量计算及转换1、变量计算 commpute :选择菜单transform 选择compute。执行Transform(转换)Compute命令,打开Compute Variable(计算变量)对话框。例如:体重指数(BMI)体重(kg)/【身高(m)】平方选择菜单transform 选择compute。Target variable栏里面输入 bmi,在后面的公式里:体重/(身高*身高)*10000

6、在Compute Variable对话框中单击If按钮,打开If Cases条件对话框。2、变量重新赋值recode 现在开始,打开执行TransformRecode,这里recode有两个选择:Into Same Variables (重新赋值给同一个变量)命令;是用新赋值的变量覆盖原有的变量。不推荐使用这种方式。Into Different Variables (重新赋值给不同变量)命令。产生一个新的变量,会在数据文件的最后,这个是不覆盖原有变量的。可以保护数据。推荐这种方式,因为使用这个过程,新产生的变量可以分析时用,不再需要是,就删去。然后,点击old and new values。弹

7、出如下对话框。我们的分组规则:18-30岁青年组,30-50岁中年组,50岁以上老年组。对话框里是重新赋值的标准,分别是在old value 旧值栏里,点击range 填入18 和30.在new value里填入1,点击add。Spss就会显示把18-30的值,都统一重新赋值为1(这里,1是代表青年组,这个我们会在稍后定义,当然你也可以填入任意数,只要在后面定义其值标签时,定义成青年)。同样操作,把中年和老年定义好。同时,如果有其他值的话,就作为系统缺失值。这里50岁以上的就要用下面的栏。下面就是定义,从某个值以上的数值。面其他值,就用all other values,定义成缺失值时,在new

8、 value里,点击system-missing。这样就可以了,点击continue,回到recode栏。点击change。最后点击ok。第4章 描述统计过程1、频数分析 Frequencies 并解释执行AnalyzeDescriptive StatisticsFrequencies命令打开 单击Statistics按钮,打开统计量选择对话框。此对话框中包括:单击Chart (图形)按钮,打开统计图对话框,对图形类型等进行设置。 Chart Type (图形类型)包括的4个单选项,其中: 单击Format按钮,打开格式对话框示。结果分析:Statistics(统计量)汇总表。 Frequen

9、cies (频数)分布表,分别用两个变量输出它们的值频数分布、累积分布等。frequency是指的频数,我们可以看出本次调查调查了118个男生,151个女生percent是百分比,也就是男生女生的频数除以总的样本数。男生占43.9%.,女生占56.1%Valid percent,有效的百分比,即有效回答的问卷占总体的百分比。Cumulative percent 是累加的百分比。即是把有效百分比依次从上往下相加,如果我们的变量是一个定序的变量,这种统计指标还是很有用的(意思是说,如果不是定序的话,这个指标就可以不看了)。Bar plot (条形图)。2、描述统计量Descriptives并解释(

10、1)执行AnalyzeDescriptive StatisticsDescriptives (描述)命令,打开Descriptives对话框。(2)从源变量清单中选择一个或多个分析变量移至Variable(s)栏中。3、数据的标准化一正态分布 (1) 打开数据文件。儿童 宇传华.sav的数据。 (2) 执行AnalyzeDescriptive StatisticsFrequencies命令。(3)选择变量身高,在左下方有一个display frequency table,输出频数表。默认情况下是打着对号的。但是这里我们点击以下鼠标,不选它,系统会弹出警告提示,大意是说你真的不需要输出频数表吗?

11、我们点击确定就可以了。然后点击chart,在里面选择histogram,就是直方图,下方有with normal curve,同样选中。输出图形如下。二、 两个群体进行比较标准化比如,假设我考人民大学,英语73分。我的同学考北京大学,英语58分。那现在要比较我们两个人的英语水平,这个时候有的同学说,比分数不就可以了,如果比分数的话,那我的英语比我同学高,但是事实上,我的英语水平不及他。因为人民大学历年的英语都是很简单的。而北大的英语题可以说非常难。这样我们两个人之间要比较的话,就需要统一标准。比如下面的数据 标准化 英语.sav。这个时候统一标准的方法,就是将两个数据都标准化。选择descri

12、ptive,选择人大英语和北大英语两个变量,勾选save standardrized as variable。结果就是在数据文件的最后两列,都会有标准化值产生。我的人大成绩73分对应的标准化值z人大英是-0.450,我同学的北大英语成绩58对应的标准化值z北大英是0.659,这个时候就可以比较了,可以看出我同学的成绩其实是比我高的。三 Descriptive(描述统计)的其他功能单击Options按钮,打开Options对话框。Discriptive里还为我们提供了其他一些常用的统计量。比如均值,标准差,方差等。如下图。四 各部分含义总量 最小值 最大值 均值 均值标准误 五画出数据的正态分布

13、曲线见上面曲线图第5章 交互分析过程1、交互分析命令Crosstabs (交叉表) 交互分析 通过交叉表或者是列联表,总之英文叫做crosstab,来展示两个变量的关系。交叉表过程可以显示两个或多个变量的联合频数分布表,简称列联表或交叉表。如图。上表就是一个曲型的交叉表,横着的行,分别是吸烟与不吸烟,竖着的列,分别是患肺癌与不患肺癌。通过横竖交叉,把我们调查的200个人分成四个类别。分别是吸烟,患肺癌:60吸烟,不患肺癌:40不吸烟,患肺癌:20不吸烟,不患肺癌:80步骤:(1)打开吸烟与肺癌.sav。(2) 选择dataweight case,打开加权对话框,选择weight case by

14、。把权数选进去。Ok执行。(3)执行AnalyzeDescriptive StatisticsCrosstabs (交叉表)命令,打开Crosstabs对话框。把两个变量分别选入row和collumn,其他默认。Ok运行。(4)运行结果如下。吸烟的人有60%患有肺癌,不吸烟的人有20%患有肺癌。吸烟的有40%的不患,不吸烟的有80%不患。(结果如果需要出现%号:重新调入crosstab过程。选择下方的cell按钮。在percentages里选择row。运行)2、如何解读(判定) 2值 ,df ,sig 值(假设检验的问题)(接上面)重新调入crosstab过程。点击statstics按钮,选择

15、chi-square。Ok运行。结果如下。上表里就是我们最终想要的统计数据。Pearson chi-square就是我们通常所说的卡方。用希腊字母就是2 。2值是33.33,df是1(自由度等于样本容量减1),sig是0.000。通常这说明,吸烟和肺癌是有关系的。吸烟会导致肺癌。两者的关系有统计意义,显著度小于0.05. 2是由皮尔逊发明的,所以在spss输出里叫做pearson chi-square2是由两个正态分布的是由n个独立的标准正态分布的平方和相加而成的。自由度为n。自由度不同,X2分布的图形不同。可以说,如果自由度限大的话,X2分布会趋近于正态分布。那么卡方怎么判定,我们用显著度来

16、判定,就是spss输出表格里的sig。Sig0.05的话,我们可以认为两个变量是有关系的,相互影响的。于显著度标准问题,我们一般用0.05来作标准, 005,Mean Difference (均值差),即样本均值与检验值100之差为-0.022含义:t :T统计量值 df (自由度)为8 双尾T检验的显著性概率Sigmean difference,均值差,这个很好算,就是9个打包机数据的均值减去100得来的。95 Confidence Interval of the Difference):样本均值与检验值偏差的95置信区间为(-0.954,0. 910),置信区间不包含0,则说明以95的置信

17、概率样本值与检验值偏差为零。接受原假设。Sig就是t的检验,遵循的还是假设检验的逻辑。如果sig0.05那么就可以认为不能拒绝原假设。u=u03、独立样本T检验 如何解读Sig 值独立样本的T检验用于检验来自正态总体的两个彼此独立的样本之间的差异。即检验两个群体的均值是否相等。独立样本的T检验的步骤如下:打开城市社会学.sav,执行AnalyzeCompare MeansIndependent-Sample T Test (独立样本T检验)命令,打开Independent-Sample T Tes对话框。从源变量清单中选择一个或几个数值型变量移入Test Variables框。这里选择你平均每

18、个月花多少钱。选择分组变量移入Grouping Variables框里,这时框内显示“变量名? ?单击Difine Groups (定义分组) 按钮,默认的是选择Use specified values,表示用分组变量的值进行分组,并在Groupl和Group2框中分别输入指定的分组变量的不同有效值,区分两个独立样本。打开对话框。分别输入1,2. (2)单击Options按钮,打开选项对话框,设置置信概率及缺失值的处理方式。它与单个样本T检验的选项对话框完全相同,默认就可以了。 (3)单击OK,提交系统运行。输出结果如下组统计量值表这里显示,男生平均每个月花527.7元,女生平均每个月花559

19、.5元,标准差更大一点,可以说女生在消费方面,差别比男生大。独立样本T检验结果表。表中显示结果分为两部分:这里表格的前两列,由一个F和sig,这个是Levenes Test for Equality Of Variances,为方差齐性检验,这个检验的是两组的方差是否相等。原假设是方相等,备择假设是不想等,sig0.166,所以接受原假设,认为两组方差是相等的。那么如果两组的方差相等,我们只看数据表格的第一栏就可以了,因为他们方差想得,第一栏是Equal variances assumed (等方差假设),这时,t=-0.802,双尾显著性概率Sig= 0.424,所以可以认为两个群体的消费水

20、平没有差别。因此应该接受原假设H。:1 =2,即男女生平均每个月花的钱是一样多的。均值差为-31.75;均值差标准误为39.589;均值差的95置信区间为(-110.210,46.717)。4、配对样本T检验 如何解读Sig 值 配对样本的T检验用于检验来自正态总体的两个彼此相关的样本均值之间的差异。打开或建立数据文件,执行AnalyzeCompare MeansPaired-Sample T Test (配对样本T检验) 命令,打开PairedSample T Test对话框。从源变量清单中选择一对或几对成对数值型变量,移入Paired Variables (配对变量)框,框内显示出“甲变量

21、乙变量”,表示这一对变量将作为比较的检验变量。 当从变量清单中选择了一个变量时,栏下Current Selections (当前选择)状态栏里显示出选中的变量名,再选择另一个变量,对话框中央的箭头按钮方可被激活,这时才允许将它们移入Paired Variables框。 (2)单击Options选项按钮,打开选项对话框,在这里设置置信水平以及缺失值的处理方式。(3) 选项确定后,单击OK提交系统运行。结果分析: 配对样本相关性检验表如表所示。 表67中的Correlation (相关系数),显示配对样本的线性相关性。相关系数为0990,不线性关系的显著性概率Sie= 0000005,说明两种轮胎

22、的磨损量具有高度的线性相关关系。 配对样本显著性检验表如表68所示。表68的显示结果为: Paired Differences (配对变量数值差)中,列出成对样本数值差的统计量值,有数值差的平均值为264克、标准差为261457克、平均标准误为8268克、95置信区间为(66965,451035)。 t统计量值t=3193:自由度为9。 T检验的双尾显著性概率Sig=0011005。005为系统默认的显著性概率,因此应该不应拒绝原假设,即可以认为性别不同,朋友数量没有显著的差异。关于sig的总结在SPSS软件统计结果中,不管是回归分析还是其它分析,都会看到“SIG”,SIG=significance,意为“显著性”,后面的值就是统计出的P值,如果P值0.01P0.05,则为差异显著,如果P0.01,则差异极显著。(职业枪手,从实例中理解意思,仅供参考)-

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 高考资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁