《SPSS基础与应用第一章教学课件.pptx》由会员分享,可在线阅读,更多相关《SPSS基础与应用第一章教学课件.pptx(41页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、SPSS 基础与应用第一章教学课件2新编21 世纪心理学系列教材SPSS 基础与应用第一章SPSS 操作基础OUTLINE4SPSS 入门01数据文件的管理025目 录SPSS 入门6数据文件与数据导入首先通过点击“FileOpenData”,在“Look in”中选择文件所在的文件夹,在“File of type”菜单中选择对应的文件类型,.csv 类型文件则选择Text(*.txt,*.csv)SPSS 入门 请到人大出版社网站下载数据文件7数据文件与数据导入选中要导入SPSS 的文件后点击“Open”SPSS 入门8数据文件与数据导入在“Text Import Wizard Step 1
2、 of 6”对话框中,“Does your text file match a predefined format?”用来定义数据是否与之前已经定义好的格式相匹配,默认为“No”,这里我们采用默认设置。点击“Next”进入下一步SPSS 入门9数据文件与数据导入第二步中,“How are your variables arranged?”对话框中识别不同变量的方式。默认选择为“Delimited”,即将文件中的空格作为变量分割的标记,变量的顺序不变,长度不变。在“Are variable names included at the top of your file?”对话框中,若文件本身第一行
3、带有各个变量名,则选择默认的“Yes”,否则选“No”。在“What is the decimal symbol?”对话框中定义小数点的表示符号,选择默认的“Period”,即小数为句点,之后点击“Next”进入下一步。SPSS 入门10数据文件与数据导入第三步中,“The first case of data begins on which line number?”默认为2,即从第二行开始读取第一个数据(第一行为变量名),“How are your cases represented?”对话框用来定义每一个个案如何界定。用户可以根据实际数据输入的格式选择每一行表示一个个案,也可以用变量数定
4、义个案。在数据文件“stu_data_quest.csv”中每位调查者的数据占一行,因此我们选择默认的“Each line represents a case”,即每行表示一个个案。在“How many cases do you want to import?”选项框中定义想要读入的个案数量。默认为“All of the cases”,即将所有个案导入,也可以选择下面两个选项,导入前N 位个案或者随机百分比数的个案。研究者的目的是将所有个案读入,因此选择默认设置。之后点击“Next”进入下一步。SPSS 入门11数据文件与数据导入第四步中,“Which delimiters appear be
5、tween variables?”选项框中,定义变量分隔符采用的符号。默认选择了“Comma”选项,即使用逗号作为变量之间的分割符。我们可以先在下方的“Data preview”中预览看数据的格式是否符合要求,若是数据多出了一列(一般该列名称为V+数据列数)则可能是由于分割符的使用不当导致了不必要的分割,出现这种情况的话可以直接在“Data preview”中观察多出来的一列中是哪些个案出现分隔错误,然后根据错误选择合适的分隔符,直到数据符合预先的设定。“What is the text qualifier?”选项中定义文本限制符,比如单引号、双引号等,默认为“None”,即没有文本限定符。在
6、数据文件“stu_data_quest.csv”中没有文本限制符,所以选择默认的“None”。之后点击“Next”。SPSS 入门12数据文件与数据导入第五步中,“Specifications for variable(s)selected in the data preview”表示预览数据的变量名称与类型,在此处可以改变变量名称.方法为点击下方“Data preview”框中对应的变量名称后,在上方对话框中“Original name”则变为对应的变量名称,修改“Variable name”设置新的变量名。之后点击“Next”进入下最后一步。SPSS 入门13数据文件与数据导入第六步中,文
7、件的格式已经设定完成。在“Would you like to save this file format for future use?”选项中可以选择“Yes”来保存当前文件,默认为“No”。“Would you like to paste the syntax?”表示是否需要保存当前选项的语法以供未来使用,默认为“No”。最后点击“Finish”即可在SPSS 中打开原来的数据。SPSS 入门14变量的定义在SPSS 软件中,有数据预览(Data View)和变量预览(Variable View)视窗,两个视窗可以点击切换。在Variable View 中可以对变量的名称、类型、宽度、小数
8、位数、变量名称加标签、变量取值加标签、定义缺失值、对齐格式以及测量的量尺进行定义。可以点开SPSS 界面左下角的“Variable View”,进入各个变量的属性界面SPSS 入门15定义变量类型若是需要改变变量的类型的话,可以点击该变量Type 框右侧边缘区域,打开“Variable Type”对话框。可以看到可提供的数据类型包括Numeric(数值)、Comma(逗号)、Dot(点)、Scientific notation(科学计数法)、Date(日期)、Dollar(美元)、Custom Currency(定制货币)、String(字符串)、Restricted Numeric(受限数字
9、),其中数字型、日期型和字符型是比较常用的数据类型。SPSS 入门16定义变量标签对于性别变量“gender”,我们可以点击该变量的Values 框右侧靠近边界区域,可以打开Values Labels 对话框,在Value 旁的空白处填入“1”,再在Label 旁的空白处填入“Female”,再点击“Add”,这样该变量的1 值就表示“Female”,同理,将数值“2”加标签“Male”,对在这个变量上没有回答的缺失数据“9”加标签“No Response”SPSS 入门17定义缺失值点击变量的Missing 框右侧靠近边界的区域,可以打开“Missing Values”对话框。“No mis
10、sing values”表示该变量没有缺失,“Discrete missing values”表示离散的缺失值,例如一些研究者可能用99 或者999 表示数据的缺失,则可以在此处填入“99”或者“999”。“Range plus one optional discrete missing value”表示某一范围内的值为缺失值。在“stu_data_quest_raw.sav”数据文件中,欺负行为、考试焦虑、成就动机和学校归属感问卷上缺失回答的题目都用数字“9”表示,这是一个离散型的缺失数据。SPSS 入门18目 录数据文件的管理19数据排序如果老师希望将学生的总成绩按照从低到高或者从高到低进
11、行排序,可以右键点击总成绩变量“ACHIEVE”变量,选择“Sort Ascending”或者“Sort Descending”。其中“Sort Ascending”表示将成绩由低到高进行排列,“Sort Descending”表示将成绩由高到低进行排列。数据文件的管理20数据排序在SPSS 中,还可以根据多个变量对数据文件进行排序。例如分别按照性别(GENDER)对学业总成绩(ACHIEVE)进行排序,我们可以同时对性别和学业成绩进行排序。操作过程如下:打开Data 菜单中的“Sort Cases”选项,然后选择需要排序的关键变量,对于排序后的文件可以选择“save file with so
12、rted data”,将其保存为另外的文件。数据文件的管理21数据排序在SPSS 中,还可以根据多个变量对数据文件进行排序。例如分别按照性别(GENDER)对学业总成绩(ACHIEVE)进行排序,我们可以同时对性别和学业成绩进行排序。操作过程如下:打开Data 菜单中的“Sort Cases”选项,然后选择需要排序的关键变量,对于排序后的文件可以选择“save file with sorted data”,将其保存为另外的文件。数据文件的管理22数据文件的合并(变量合并)首先打开两组数据“stu_data_quest.sav”和“stu_data_achieve.sav”。我们需要将文件1 的
13、数据合并到文件2 中,点开“DataMerge FilesAdd Variables”。此时由于已经打开了需要合并的文件,因此选中“An open dataset”下方的选项栏中的文件,点击“Continue”。由于我们是按照ID进行匹配,因此选择默认的“One-to-one merge based on key values”,之后点击OK。然后我们就可以看到两个文件的数据按照ID进行了组合。数据文件的管理23数据文件的合并(变量合并)首先打开两组数据“stu_data_quest.sav”和“stu_data_achieve.sav”。我们需要将文件1 的数据合并到文件2 中,点开“Dat
14、aMerge FilesAdd Variables”。此时由于已经打开了需要合并的文件,因此选中“An open dataset”下方的选项栏中的文件,点击“Continue”。由于我们是按照ID进行匹配,因此选择默认的“One-to-one merge based on key values”,之后点击OK。然后我们就可以看到两个文件的数据按照ID进行了组合。数据文件的管理24数据文件的合并(变量合并)首先打开两组数据“stu_data_quest.sav”和“stu_data_achieve.sav”。我们需要将文件1 的数据合并到文件2 中,点开“DataMerge FilesAdd V
15、ariables”。此时由于已经打开了需要合并的文件,因此选中“An open dataset”下方的选项栏中的文件,点击“Continue”。由于我们是按照ID进行匹配,因此选择默认的“One-to-one merge based on key values”,之后点击OK。然后我们就可以看到两个文件的数据按照ID进行了组合。数据文件的管理25数据文件的合并(样本合并)我们首先打开数据文件“stu_data_cb1.sav”和“stu_data_cb2.sav”文件,我们的目标是将“stu_data_cb2.sav”文件中的数据合并至“stu_data_cb1.sav”文件中;两份文件的变量
16、一模一样,不同的是第一份数据收集的是女生的数据,第二份文件收集的是男生的数据。点开点开“DataMerge FilesAdd Case”,此时由于已经打开了需要合并的文件,因此选中“An open dataset”下方的选项栏中的文件,点击“Continue”。数据文件的管理26数据文件的合并(样本合并)由于两组文件的变量完全一致,因此在左侧“Unpaired Variables”栏中为空白(图1-19),这时我们可以直接点击“OK”,就可以完成两个文件的合并。数据文件的管理27数据的筛选(分类变量)打开Data 菜单中的“Select Caces”选项,在Select选项框中选择“If co
17、ndition is satisfied”,再点击“If.”,双击左侧菜单的GENDER 变量,使GENDER 出现在右侧空白框内,之后再在下方键盘点击“=”和“1”,即我们需要选择“gender=1”的变量。完成后点击“Continue”。在Output 选项框中选择默认的“Filter out unselected cases”,即将所有未被选择到的样本暂时剔除掉。若是选择“Copy selected cases to a new dataset”,则可以将选择的样本在新的数据集中打开。若是选择“Delete unselected cases”则会将该文件中所有未选中的样本删除。这里我们还
18、是选择默认的“Filter out unselected cases”选项,点击“OK”。数据文件的管理28数据的筛选(分类变量)打开Data 菜单中的“Select Caces”选项,在Select选项框中选择“If condition is satisfied”,再点击“If.”,双击左侧菜单的GENDER 变量,使GENDER 出现在右侧空白框内,之后再在下方键盘点击“=”和“1”,即我们需要选择“gender=1”的变量。完成后点击“Continue”。在Output 选项框中选择默认的“Filter out unselected cases”,即将所有未被选择到的样本暂时剔除掉。若是
19、选择“Copy selected cases to a new dataset”,则可以将选择的样本在新的数据集中打开。若是选择“Delete unselected cases”则会将该文件中所有未选中的样本删除。这里我们还是选择默认的“Filter out unselected cases”选项,点击“OK”。数据文件的管理29数据的筛选(连续变量)假设我们对于数学学业成绩大于等于400 且小于等于600 的被试感兴趣,我们同样可以通过“DataSelect CacesIf condition is satisfiedIf.”。数学成绩的变量名是MATH 在“Select Cases:If”
20、选项框中右侧的空白框中输入“MATH=400&MATH=600”后点击“Continue”,再点击“OK”。数据文件的管理30变量的编码与转换点击“TransformRecode into Different Variables”选项框,即我们需要将一个变量重新编码为一个新的变量。双击左侧变量栏中的“EXOEDU”变量,在右侧“Output Variable”栏的“Name:”栏中编写新的变量名。数据文件的管理31变量的编码与转换点击“Change”,然后点击下方“Old and New Values.”按钮。在左侧“Old Value”中选择“Range”,我们希望将水平1 和2 重新编码为
21、1,在“Range”下方的空白栏中填入“1”,在“through”下方的空白栏中填入“2”,在右侧“New Value”栏的“Value”中填入“1”,点击下方的Add,这样我们就成功将水平1 和2 设置为一个新的水平1。重复该操作,设置水平3 到5 为2。然后选中“Old Value”栏中的“Value:”,在下方空白栏填入“6”,在右侧“New Value”栏的“Value”中填入3,再选中左侧“old Value”栏中的“System-missing”以及右侧“New Value”栏中的“System-missing”,点击“Add”,如图所示。数据文件的管理32变量的计算(mean 函
22、数)点击“TransformCompute Variable”,在“Target Variable”下方的空白栏填入需要存储为平均数的新变量名。之后在“Numeric Expression:”下方的空白栏内输入“mean()”,再在括号内输入这六个维度的变量名,也可以双击左侧需要进行计算的变量,各个变量以“,”分隔,如图所示。需注意的是,以上的标点均为英文标点。数据文件的管理33变量的计算(公式)也可以在Numeric Expression:下方的空白栏处使用数学公式来进行计算,如图所示,同样也可以计算平均数,不过该方法在处理缺失作答上与上述mean函数不同,该方法只有6 道题目的数据不存在缺
23、失的情况,该维度的平均分才能计算得到。若是被试在题目上的作答存在缺失,则该方法无法对被试的平均分进行有效计算,得到的维度分数为缺失数据。数据文件的管理34变量的计算(按照缺失值数量计算)学校归属感这个维度有6 个题目,研究者认为,只要被试在这6 个题目有5 个及以上的作答,我们就应该保留他的平均数结果,对于那些存在两个即以上缺失作答的被试,我们希望剔除他的作答。即只要被试在该问卷中存在五个及以上的有效作答,我们就对其作答结果求平均数,否则对该被试进行剔除。在SPSS 中可以通过以下操作来完成,如图,在“Numeric Expression:”下方的空白栏内输入“mean.5()”,然后和之前计
24、算平均值的方式一样将要计算的变量放入括号内,以逗号隔开,再点击“OK”,这样就可以对所有存在5 个及以上有效作答的被试进行均值的计算。数据文件的管理35数据文件的拆分点击“DataSplit File”后,可以看到对话框右侧有三个选项。Analyze all cases,do not create groups表示分析所有个案;Compare groups 表示比较组;Organize output by groups 表示按照组呈现分析结果,这里我们选择Compare groups 后双击性别变量,如图所示。下方我们选择默认的“Sort the file by grouping variab
25、les”,表示按照分组对文档排序。之后点击OK,就可以看到数据文件按照不同性别进行了排列。同时在屏幕的右下角出现了“Split by GENDER”,说明数据文件目前处于拆分状态,在此状态下,后期所有数据分析将分别按照性别进行分析。数据文件的管理36数据文件的拆分点击“DataSplit File”后,可以看到对话框右侧有三个选项。Analyze all cases,do not create groups表示分析所有个案;Compare groups 表示比较组;Organize output by groups 表示按照组呈现分析结果,这里我们选择Compare groups 后双击性别变
26、量,如图所示。下方我们选择默认的“Sort the file by grouping variables”,表示按照分组对文档排序。之后点击OK,就可以看到数据文件按照不同性别进行了排列。同时在屏幕的右下角出现了“Split by GENDER”,说明数据文件目前处于拆分状态,在此状态下,后期所有数据分析将分别按照性别进行分析。数据文件的管理37数据的分类汇总(方法1)打开数据文件“stu_data.sav”,点击“DataAggregate”。将性别变量“GENDER”以及是否留级变量“REPEAT”放入“Break Variable(s)”选项框中,然后将数学成绩变量“MATH”放入下方“
27、Summaries of Variable(s)”选项框中,下方的“Function”点开后可以选择要统计的函数,默认为平均值,也可以选择中位数、总和、标准差、最小值等。Save 栏中选择“Create a new dataset containing only the aggregated variables”,即创建一个只包含汇总数据的数据集,然后在“Dataset name”栏输入新数据集的名称,然后点击“OK”。即可看到一个新的文件,第一列为性别变量,第二列为是否留级,第三列则为该类别的数学成绩。如数据的第一行表示未留级女生的平均数学成绩,第二行为留级女生的平均数学成绩。数据文件的管理
28、38数据的分类汇总(方法1)打开数据文件“stu_data.sav”,点击“DataAggregate”。将性别变量“GENDER”以及是否留级变量“REPEAT”放入“Break Variable(s)”选项框中,然后将数学成绩变量“MATH”放入下方“Summaries of Variable(s)”选项框中,下方的“Function”点开后可以选择要统计的函数,默认为平均值,也可以选择中位数、总和、标准差、最小值等。Save 栏中选择“Create a new dataset containing only the aggregated variables”,即创建一个只包含汇总数据的数
29、据集,然后在“Dataset name”栏输入新数据集的名称,然后点击“OK”。即可看到一个新的文件,第一列为性别变量,第二列为是否留级,第三列则为该类别的数学成绩。如数据的第一行表示未留级女生的平均数学成绩,第二行为留级女生的平均数学成绩。数据文件的管理39数据的分类汇总(方法1)打开数据文件“stu_data.sav”,点击“DataAggregate”。将性别变量“GENDER”以及是否留级变量“REPEAT”放入“Break Variable(s)”选项框中,然后将数学成绩变量“MATH”放入下方“Summaries of Variable(s)”选项框中,下方的“Function”点
30、开后可以选择要统计的函数,默认为平均值,也可以选择中位数、总和、标准差、最小值等。Save 栏中选择“Create a new dataset containing only the aggregated variables”,即创建一个只包含汇总数据的数据集,然后在“Dataset name”栏输入新数据集的名称,然后点击“OK”。即可看到一个新的文件,第一列为性别变量,第二列为是否留级,第三列则为该类别的数学成绩。如数据的第一行表示未留级女生的平均数学成绩,第二行为留级女生的平均数学成绩。数据文件的管理40数据的分类汇总(方法2)方法2 使用了前一小节数据文件拆分的方法:先将数据按照性别“GENDER”和是否留级“REPEAT”进行拆分。右键数学成绩变量“MATH”,选择“Descriptive Statistics”。在output 文件中会输出描述统计的结果。数据文件的管理41数据的分类汇总(方法2)方法2 使用了前一小节数据文件拆分的方法:先将数据按照性别“GENDER”和是否留级“REPEAT”进行拆分。右键数学成绩变量“MATH”,选择“Descriptive Statistics”。在output 文件中会输出描述统计的结果。数据文件的管理