《外语教学科研中的统计之SPSS篇2ppt课件.ppt》由会员分享,可在线阅读,更多相关《外语教学科研中的统计之SPSS篇2ppt课件.ppt(56页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、外语教学科研中的统计之SPSS篇2ppt课件 Still waters run deep.流静水深流静水深,人静心深人静心深 Where there is life,there is hope。有生命必有希望。有生命必有希望一、一、教育统计学概述:分类教育统计学概述:分类&1.1 分类分类&描述统计(descriptive statistics)描述数据全貌。包括数据分组,使用统计图表描述数据的分组和分布,计算数据参数。&推断统计(inferential statistics)依据随机样本数据,从局部推断总体特征。包括参数检验和非参数检验、方差分析、回归分析、因子分析等。2022/11/102
2、一、一、教育统计学概述:基本概念教育统计学概述:基本概念&1.2 1.2 基本概念基本概念&1.2.1 变量(variable)研究活动中的关键因素。相对于常量而言(在研究过程中始终保持不变的特征或条件)。自变量(independent variable):教学方法 因变量(dependent variable):学生成绩 中间变量(interdependent variable):学习风格&如:研究者经常在课题的研究对象(某一层次的学习者)中安排不同风格的学习者。当某个自变量自变量(如教学方式)变化时,可以观测到因变量(学习成绩)的相应变化及其规律。然后针对不同学习风格的研究对象(中间变量)
3、,再观察上述教学现象规律有何变化。2022/11/103一、一、教育统计学概述:基本概念教育统计学概述:基本概念&1.2.2 总体(population)、个体(individual)、样本(sample)研究对象的全体为总体,组成总体的基本单元为个体,按照一定规则从总体中抽取的一部分个体为样本。&1.2.3 样本容量(sample size)无严格的数量界限。一般把样本容量小于30(50、100)的样本称为小样本,大于等于30(50、100)的为大样本。2022/11/104&1.2.4正态分布(normal distribution)正态分布是连续型随机变量分布中最重要也是最常见的一种分布
4、。例如,在人数较多的群体中,学习成绩得到的数值,其分布近似于正态分布即测验分数都是中等分数人数多,高分、低分人数少,如果以分数为横坐标,次数获得某一分数的人数)为纵坐标,绘制成曲线图,就会发现曲线呈中间大、两头小、左右基本对称的特点。一、一、教育统计学概述:基本概念教育统计学概述:基本概念来源:Bachman,L.F.(1990).Fundamental Considerations in Language Testing.Oxford:OUP,p.73 2022/11/105一、一、教育统计学概述:基本概念教育统计学概述:基本概念&1.2.5 SPSS中的变量分类(1)定量/连续变量/等距变
5、量(scale measure)一定单位的实际测量值,可以加减计算,如学生的考试成绩(65,76)(2)分类变量(包括定序变量 和称名变量)定序变量(ordinal measure):能够把研究对象从高到低或由大到小排序,如受教育程度(1小学,2初中,3高中,4大学,5研究生);又如态度(1完全不适合,2通常不适合,3有时适合,4通常适合,5完全不适合)称名变量(Nominal measure):也叫无序变量,变量值没有大小之分,只有类别之分,如性别(1男,2女)2022/11/106一、一、教育统计学概述:基本概念教育统计学概述:基本概念&1.2.6 参数检验和非参数检验参数检验(param
6、etric test):总体服从正态分布、数值连续变量、样本数为单一样本或双样本。如T检验、两个或两个以上样本为方差分析等。非参数假设检验(non-parametric test):总体不一定服从正态分布、数值为定序变量(有时为连续变量)、样本数为单一样本、双样本或多样本。如X2 检验、检验、Wilcoxon 检验、Mann-Whitney U检验&1.3 统计分析简要流程图2022/11/107一、一、教育统计学概述:统计模型教育统计学概述:统计模型&1.4 统计模型和数据类型模型类型模型类型因变量因变量自变量自变量Regression连续变量连续变量或者分类变量Logistic Regre
7、ssion分类变量连续变量或者分类变量ANOVA,GLM连续变量分类变量或者连续变量Log-Linear分类变量分类变量SEM不限不限来源:Wu,Eric(2008,9.6-7).Introduction to SEM.上海:上海财经大学.2022/11/108一、一、教育统计学概述:正态分布的检验教育统计学概述:正态分布的检验&正态分布的检验正态分布的检验 参数检验分析法的前提是数据服从正态分布和方差齐性,除非对数据作转换,非正态分布的数据宜采用非参数检验。2022/11/109SPSS规定:当样本容量3n5000,结果以Shapino-Wilk(W检验)为准,当样本容量n5000时,结果以
8、Kolmogorov-Smirnov(D检验为准)。结论:n5000,W值得概率PZ1)。评分公正欠佳!评分公正欠佳!2022/11/1021二、实战操作2.2.3前提条件三 如果数据来自不同群体的受试者,而且比较的是两组数据之间的差异,那么:参数检验:两个独立样本t 检验(independent samples t-test)非参数检验:Mann-Whitney U检验(连续变量)Crosstabs 检验(称名变量或定序变量)2022/11/1022参数检验:两个独立样本t 检验(independent samples t-test)举例举例5 5:已知72名男女学生的两个学期课外学习时间,
9、问:男女学生在努力程度上是否存在显著性差异?二、实战操作:两个独立样本t检验2022/11/1023注备:Equal varince assumed假设方差相等,本例的方差齐性(sig.0.05)。结论:男女学生在努力程度上存在显著差异,女生努力程度明显高于男生。2022/11/1024二、实战操作:两个独立样本t检验举例举例6 6:某校对英语课进行教学改革试验,选取甲、乙两个平行班作试点。甲班30人,采用传统的教师讲授的教学方法,乙班33人,采用教师只讲授重点,主要由学生自学和学生相互讨论的方法。一学年后,用同一份试题对两个班的学生进行测验。试问:这两种教学方法的效果是否有显著性的差异?结论
10、:这两种方法的效果没有显著差异!(注意两个平行班的方注意两个平行班的方差不等,应看差不等,应看Equal variance not assuemed一栏的结果一栏的结果)原因:也许是测试没有体现出教改的优势!测试没有体现出教改的优势!2022/11/1025二、实战操作2.2.3前提条件四如果比较的是三组或多组数据之间的差异,那么:来自多个独立样本的数据:参数检验:单因素方差分析(One-way ANOVA)非参数检验:Kruskal-Wallis检验(连续变量,常用);中位数(Median)检验(连续变量)来自多个相关样本的数据:参数检验:单因素重复测量方差分析(repeated measu
11、res ANOVA)多因素方差分析(Factorial ANOVA)非参数检验:Friedman检验(连续变量);Kendall检验(定序变量);Cochrans Q检验(称名变量)2022/11/1026二、实战操作:Kruskal-Wallis检验非参数检验:多个独立样本:中位数检验(Median test)(适用于等距变量)Kruskal-Wallis检验(适用于等距变量,更常用)举例举例7:某校对大二学生进行了一次英语测验。现分别从经济系、政法系、中文系、教育系以及理科各系中随机抽取部分学生的测验成绩。问:不同学科学生的英语成绩是否存在显著性差异?2022/11/1027非参数检验表明
12、不同学科之间的学生英语成绩存在显著差异,但却没法绘制图表,也无法详细比较可采用参数检验的单尾ANOVA分析,制作平均分线图。2022/11/1028二、实战操作:多个样本Kendall检验举例举例8:5位教师对甲、乙、丙3篇作文所作的评价如下,问5 位教师对评价3篇作文所作的评价是否一致。注意输入方法!注意输入方法!2022/11/1029结论:5 位教师对3篇作文所作的评价是不一致(p0.05)。标准制定和阅卷教师培训很重要!标准制定和阅卷教师培训很重要!2022/11/1030二、实战操作:单因素方差分析基本思想:通过分析不同来源的变异对总变异的贡献大小,从而确定可控因素对研究结果影响力的
13、大小。一项实验有多个影响因素,如果只有一个因素在发生变化,其他因素保持不变,称为单因素方差分析。(One-way ANOVA)举例举例9:为了寻求较好的词汇习得方法,现选择3种不同方法,分别对3个平行组学生进行一学期的词汇习得训练,现获得学生的期末成绩。问:3种不同方法下的学生词汇习得成绩是否有显著性差异?哪种更理想一点?2022/11/1031单因素事后多重比较假设方差相等时可选用LSD或S-N-K等方法;若方差不等可采用Dunnetts C方法。检验方差是否齐性;平均数做图2022/11/1032方差齐性检验表明,三种教学方法所获得的成绩方差相等。ANOVA显示,三种方法的成绩差异显著,可
14、以进一步做多重比较LSD方法显示各教学方法的成绩差异显著。2022/11/1033结论:3种不同方法下的学生词汇习得成绩有显著性差异。相比而言,第三种教学方法更理想一点。2022/11/1034二、实战操作:多因素方差分析如果有两个或两个以上的因素发生变化,那么对应的方差分析称为多因素方差分析。几个因素(变量)对实验结果的影响有两种情况:A 独立影响(between-subject design),如单因素方差分析和双因素方差分析。B 交互影响(within-subject design),如单因素重复测量方差分析和双因素混合方差分析。2022/11/1035二、实战操作:双因素方差分析A 独
15、立影响(between-subject design),单因素方差分析(例9)和双因素方差分析。双因素方差分析举例举例10:8名评委对5篇论文的评分如下,试分析5篇论文的水平差异是否显著?评委对评分标准所掌握的分寸是否一致?(三个变量)论文得分的多少主要受到两个因素的影响:一个是论文本身的水平,另一个是评委对评分标准所掌握的分寸(但两者之间无交互作用)。需要检验的假设如下:5篇论文的水平无显著性差异;评委对评分标准所掌握的分寸无显著性差异。2022/11/1036当因变量只有一个(本例为学生的作文成绩),采用GLM的Univariate方法。固定因素指的是在样本中它所有可能的取值都出现了;而随
16、机效应的因素指的是所有可能的取值在样本中没有都出现,或不可能都出现,两种情况结论完全相同,不同的只是推论。张文彤(2004),SPSS统计分析高级教程,北京:高等教育出版社。2022/11/1037本研究只分析独立影响,无交互效应,所以选Main Effects。左下方的Sum of squares框用于选择方差分析模型类别,有1型到4型四种,如果搞不清他们之间的区别,使用默认的3型即可;中下部有个Include intercept in model复选框,用于选择是否在模型中包括截距,不用改动,默认即可(但用处不大,可以不选!)。2022/11/1038可以定义输出哪些指标的估计均数、并做两
17、两比较,还有其他一些输出,如常用描述指标、方差齐性检验等。2022/11/1039首先是所用方差分析模型的检验,F值为28.277,p小于0.05,因此所用的模型有统计学意义,可以用它来判断模型中系数有无统计学意义。第二行是截距,它在我们的分析中没有实际意义,忽略即可。第三行是变量论文,可见它也有统计学意义,不过我们关心的也不是它;第四行是我们真正关心的变量评委,非常遗憾,它的p值为0.061,还没有统计学意义。我们的结论是:5篇论文的水平有显著差异;但是篇论文的水平有显著差异;但是评委对评分评委对评分标准所掌握的分寸一致标准所掌握的分寸一致(左边的同质性检验也说明这一点)。注:Partial
18、 Eta Squared指主效应的大小,值越大,效应越强。本研究表明学生作文成绩严重受到论文和评委的共同影响。但是评委自身对作文成绩的影响较弱。2022/11/1040右图是八个评委的作文打分分布左图是五篇作文的整体分布2022/11/10412022/11/1042二、实战操作:协方差分析协方差分析 将那些很难控制的因素作为协变量,在排除协变量影响的条件下,分析控制变量对观察变量的影响,从而更加准确地对控制变量进行评价。无论是单因素方差分析还是多因素方差分析,它们都有一些人为可以控制的控制变量。在实际问题中,有些随机因素是很难人为控制的,但它们又会对结果产生显著的影响。如果忽略这些因素的影响
19、,则有可能得到不正确的结论。举例举例11:研究一个班3组同学(分别接受了3种不同的教学方法)在英语成绩上是否有显著差异。2022/11/1043首先应进行预分析,了解数据是否符合协方差分析的要求,最重要的一点就是看入学成绩的影响在三组中是否相同,这可以用入学成绩与组别是否存在交互作用来表示。该步骤用于判断入学成绩和组别间是否存在交互作用,如存在,则协方差分析的条件不满足,分析不能继续。注意这里选择了Model I,从而拟合结果和模型中变量的引入顺序有关,即侧重点在入学成绩对英语成绩的影响大小和交互作用上。2022/11/1044显示交互作用无统计学意义,而且P值非常大,因此交换组别和入学成绩多
20、半交互作用也无统计学意义,因此可以不继续作预分析了,当然,严格的步骤应当交换两者的顺序继续进行预分析。正式分析开始!2022/11/10452022/11/1046各组英语成绩方差相等模型拟合很好。组间差异显著,各组入学成绩没显著差异,从而可以分析组别之间英语成绩的差异。三组学生英语成绩2022/11/10471、3组和2、3组成绩差异显著;1、2组之间无显著差异。结论:三组学生成绩差异显著2022/11/1048二、实战操作:积差相关法 相关分析 A:积差相关法 是指采用英国统计学家Pearson皮尔逊提出的一种计算相关系数的方法。举例举例12:某大学一年级12名学生参加了语音、听写和语法三
21、项考试。问:三项考试之间的两两相关系数。2022/11/1049二、实战操作:等级相关法B:等级相关法 当我们研究的变量是定序数据,或者变量不是正态分布时,若要考察它们的相关程度就必须采用等级相关法。它是依据具有等级顺序的测量数据(定序数据)来研究变量间相互关系的方法。主要有Spearman斯皮尔曼相关(适用于非参数两列相关)和Kendall W肯德尔和谐系数(较保守,不如Spearman)相关。举例举例13:其教研室要为学生准备一批英语课外阅读材料,教研室首先让一批学生读八篇材料,要求他们根据自己的感受,为这些材料的难易程度评定等级(等级分为九级,一级为特别简单,九级为极端困难)。然后让一批
22、老师也为这八篇材料评定难易度等级。这样得到下面数据。学生:3 5 6 8 8 9 4 7老师:1 3 7 9 6 8 2 9现在,要检验这两组变量是否有显著相关。2022/11/1050学生评定和老师评定的一致性系数为0.667,显著相关,但是难度认可的相同程度为40%,不甚理想。学生和教师的认知程度和学习经验有差异,有时为了公正征求学生的看法,但结果往往不甚理想。建议:学生意见仅供参考!学生意见仅供参考!2022/11/1051二、实战操作:点二列相关法C:点二列(point-biserial)相关法研究中,常常有只含两个类别的变量(称名变量),例如性别、是否达标、正确与否等等。这类只有两种
23、变化结果的称名变量称为“二分”称名变量。将0、1 分别与两种变化结果相对应,则对“二分”称名变量的一系列观察,得到一个“二分”数列。一个连续变量的一系列观测值是一个点数列。如果一个点数列中的点与一个“二分”数列中的点存在一一对应的关系,则称这两个数列为点二列。点二列相关法就是考查连续变量(其观测值为点数列)与“二分”称名变量之间的相关程度。举例举例14:某小学五年级男女学生I5人的英语成绩如下表,问英语成绩与性别是否有关?2022/11/1052二、实战操作:偏相关D:偏相关(partial)在教育领域中两种现象之间的关系,往往受到多种因素的影响,是这些因素共同作用的结果,因而简单相关系数可能
24、由于其他因素的影响而反映的仅仅是表面非本质的联系,不能真正反映两个变量之间的相关程度。为了正确地显示出两个变量之间的本质联系,必须剔除其他变量的影响。我们把两个变量在剔除了其他变量的影响之后的相关系数叫做偏相关系数。举例15:傣族的母语是傣语,儿童小学开始学习汉语,上中学时又学习英语。近来研究人员对30名受过高等教育的傣族成年人进行了傣语、汉语及英语三种语言的水平测试。问三种语言水平考试的相关关系,特别是傣语与英语的关系。2022/11/1053三种语言之间的相关显示,在没有控制汉语对英语和傣语之间的影响时,傣语和英语成绩显著相关,r=0.560这时英语和傣语相关为0.6572022/11/1
25、054参考文献参考文献Bachman,L.F.(1990).Fundamental Considerations in Language Testing.Oxford:OUP,p.73史耕山,(史耕山,(20072007年年6 6月月1313日),日),外语教学科研中的统计与SPSS实现讲义和数据。河北工业大学外国语学院/中国外语教育研究中心.http:/202.204.128.82/forum/(2009年5月31日)。张文彤,2004,SPSS统计分析高级教程。北京:高等教育出版社。2022/11/1055愿我们共同进步,攀登学术上的the Himalayas!谢谢大家!2022/11/1056