《外语教学中的统计方法.ppt》由会员分享,可在线阅读,更多相关《外语教学中的统计方法.ppt(40页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、外语教学中的统计方法外语教学中的统计方法现在学习的是第1页,共40页为什么要学习统计方法?为什么要学习统计方法?l1.统计方法给我们一种看问题的视角、分析问题的手段,使我们可以从数量的角度,分析和认识现象的特点、规律、模式、趋势或关系。l2.统计方法给我们一种精确测量的手段。例如对于“水平高”的概念,我们可以用数学计量的手段给予更精确的描述。l3.可以使我们对现象的数量表现,做出更科学的判断。l4.增强研究的自主性。数据收集的过程是自主的,对数据的处理和分析是原创的,得出的结论大大避免了抄袭的危险。现在学习的是第2页,共40页第一讲第一讲 基本概念基本概念1.数据类型:定类数据与定距数据2.总
2、体与样本3.误差:抽样误差与非抽样误差4.显著性与显著水平 1.不同的数据需要采用不同的统计方法;2.人们一般研究的都是样本;3.统计中误差无所不在;4.显著性反映的是研究结论的确定性。现在学习的是第3页,共40页数据类型之:定类数据数据类型之:定类数据 定类数据是一种分类数据。它是对观测对定类数据是一种分类数据。它是对观测对象按不同特性分类,并统计各类出现的次数象按不同特性分类,并统计各类出现的次数(频数)后得到的结果。(频数)后得到的结果。例如可以按性别、班级、课程等进行分类统计。定类测量中的类没有大小之分,只有频数高低。不能在类之间进行数学运算。性别(n=50)课程(n=50)男(1)女
3、(2)精读写作口语翻译 20 30 45 40 20 48现在学习的是第4页,共40页数据类型之:定距数据数据类型之:定距数据 定距数据是对测量对象按一定尺度测定距数据是对测量对象按一定尺度测量后得出的数值。所用测量尺度有恒定的量后得出的数值。所用测量尺度有恒定的单位,单位之间的距离是相等的。单位,单位之间的距离是相等的。例如对成绩、年龄等的测量通常得到的是定距数据。人们可以对定距数据进行数学运算,比较不同数值之间的大小。A班学生的期末考试成绩(n=25)66 68 69 56 77 74 57 72 74 64 80 58 68 51 82 72 75 63 84 78 67 71 76 7
4、5 66 现在学习的是第5页,共40页总体总体总体指具有相同特征或者性质的所有个体之总体指具有相同特征或者性质的所有个体之和。总体可大可小。例如二语学习者是大总和。总体可大可小。例如二语学习者是大总体,某校一年级新生则是小总体。体,某校一年级新生则是小总体。样本样本指从总体中选取的一部分个体。由于常常不能直接研究总体,所以人们常常通过样本来推断总体。样本有随机样本和非随机样本之分。现在学习的是第6页,共40页抽样误差抽样误差抽样误差是客观存在。只要从总体中抽样误差是客观存在。只要从总体中抽取样本,就会存在抽样误差。抽取样本,就会存在抽样误差。从一个总体中抽取的样本均值与总体均值之间多数存在差异
5、。从一个总体中抽取的不同样本均值之间也多数存在差异。为了减少抽样误差,最好用随机抽取的大样本。现在学习的是第7页,共40页Mean=28Mean1=25Mean2=30现在学习的是第8页,共40页非抽样误差非抽样误差非抽样误差是由于技术上原因,如测量工非抽样误差是由于技术上原因,如测量工具不准,或是人为操作造成的误差。具不准,或是人为操作造成的误差。比较典型的非抽样误差是考试分数合计错误,或者是数据录入失误。避免非抽样误差的方法是仔细测量和认真录入与核对。现在学习的是第9页,共40页显著性显著性显著性的概念涉及统计分析结果的可靠性。显显著性的概念涉及统计分析结果的可靠性。显著性检验用于验证统计
6、结果是自然存在的还是著性检验用于验证统计结果是自然存在的还是由偶然因素如误差造成的。由偶然因素如误差造成的。显著性水平显著性水平是衡量显著性的标准。在社会科学和应用语言学研究中,通常设定的显著水平为p=0.05。大于0.05的统计结果,通常说无显著差异,或无显著相关。等于/小于0.05的统计结果,通常说有显著差异,或显著相关。现在学习的是第10页,共40页描述统计描述统计平均值、标准差、交互表、频数表现在学习的是第11页,共40页平均值:所有个值之和除以个值的数目。平均值:所有个值之和除以个值的数目。总体均值用总体均值用表示,表示,样样本均本均值值用用表示。表示。现在学习的是第12页,共40页
7、70个学生的四级平均成绩个学生的四级平均成绩现在学习的是第13页,共40页标准差:是数据内部差异的一种量度。标准差:是数据内部差异的一种量度。标准差越大,内部差异也越大。标准差越大,内部差异也越大。例:两个班期末考试平均分相等,甲班例:两个班期末考试平均分相等,甲班的标准差为的标准差为5分,乙班的标准差为分,乙班的标准差为10分,分,说明乙班的内部差异大于甲班。说明乙班的内部差异大于甲班。现在学习的是第14页,共40页70个学生四级成绩的标准差现在学习的是第15页,共40页Empirical Rule1 经验法则经验法则1正态分布的数据 -1 +1l大约68的数值在均值的一个标准差范围内现在学
8、习的是第16页,共40页Empirical Rule2l正态分布的数据l -2 +2l大约95的数值在均值的2个标准差范围内。现在学习的是第17页,共40页Empirical Rule3l正态分布的数据 -3 +3l几乎全部(99.7)数值在3个标准差范围内。现在学习的是第18页,共40页大学英语四级考试成绩分布大学英语四级考试成绩分布均值:500 标准差:70 430 500 570l大约68的四级考试分数在430到570之间。现在学习的是第19页,共40页大学英语四级考试成绩分布大学英语四级考试成绩分布2l 360 500 640l大约95的考试分数在360到640之间。现在学习的是第20
9、页,共40页英语四级考试成绩分布英语四级考试成绩分布 290 500 710l几乎全部(99.7)数值在290到710之间。现在学习的是第21页,共40页交互表交互表交互表是对定类数据的一种归纳和表交互表是对定类数据的一种归纳和表现形式。交互表根据行数和列数,分现形式。交互表根据行数和列数,分别有别有2x2表表,2x3表,或者表,或者j x k表。表。焦虑成绩 正常 不正常 及格 60 7 不及格 4 30 现在学习的是第22页,共40页频数表频数表一种频数表是简单罗列数据中每个数值出现一种频数表是简单罗列数据中每个数值出现的次数;另一种频数表是按一定的区间,分的次数;另一种频数表是按一定的区
10、间,分组统计和罗列数值出现的次数。组统计和罗列数值出现的次数。数值频数数值频数 55 56 58 59 60 62 6523451089 70 75 81 86 89 90 91 13 10 7 5 3 2 1数值区间频数 55-59 60-69 70-79 80-89 90-99 14 27 23 15 3现在学习的是第23页,共40页推断统计推断统计推断统计主要根据概率理论,利用各推断统计主要根据概率理论,利用各种分布模型,进行组之间、变量之间种分布模型,进行组之间、变量之间的差异或相关的显著性检验。的差异或相关的显著性检验。推断统计主要回答的问题是:1)不同组或不同变量的均值之间存在的差
11、异是否显著?2)两个变量之间的相关关系是否显著?现在学习的是第24页,共40页常用的差异检验方法常用的差异检验方法1)独立样本的)独立样本的t检验检验2)成对样本的)成对样本的t检验检验3)一元方差分析)一元方差分析4)卡方检验)卡方检验一般情况下:1)如果数据是定距数据,根据数据情况,分别采用前三种方法;2)如果数据是定类数据,采用卡方检验的方法。现在学习的是第25页,共40页独立样本独立样本t检验检验(independent sample t-test)独立样本独立样本t检验用于检验同一个变量下的两组检验用于检验同一个变量下的两组数值之间是否存在显著差异。数值之间是否存在显著差异。应用的研
12、究问题:1)一次考试中的两个班的成绩是否存在显著性差异?2)一次考试中的男女生的成绩是否存在显著性差异?现在学习的是第26页,共40页独立样本独立样本t检验要看计算出的检验要看计算出的t值和对应的值和对应的sig.值,或者说显著性水平。如果值,或者说显著性水平。如果sig.值大于值大于0.05,两组之间没有显著差异,如果,两组之间没有显著差异,如果sig.值值小于小于0.05,两组之间存在显著差异。在报告,两组之间存在显著差异。在报告时,要报告时,要报告t值和值和sig.值。值。例:独立样本t检验的结果显示,多媒体教学实验班和常规教学班(对照班)的英语水平不存在显著性差异(t=1.11,p0.
13、05)。也就是说,多媒体教学并没有带来比常规教学更好的教学效果。现在学习的是第27页,共40页成对样本的成对样本的t检验检验(paired sample t-test)成对样本的成对样本的t检验用于检验就同一个变量对同检验用于检验就同一个变量对同一组对象两次收集的数据之间是否存在显著差一组对象两次收集的数据之间是否存在显著差异。异。应用的研究问题:1)某年级学生进校时英语水平和现在英语水平之间是否存在显著差异?2)某级学生经过一年的学习后,学习动机是否发生了改变?现在学习的是第28页,共40页成对样本成对样本t检验也看计算出的检验也看计算出的t值和对应的值和对应的sig.值,或者说显著性水平。
14、如果值,或者说显著性水平。如果sig.值大于值大于0.05,成对样本没有显著差异,如果,成对样本没有显著差异,如果sig.值值小于小于0.05,样本之间存在显著差异。在报告时,样本之间存在显著差异。在报告时,要报告要报告t值和值和sig.值。值。例:成对样本t检验的结果显示,某年级新生进校后经过一段时间的学习,成绩有了显著提高,第二次考试成绩显 著 高 于 进 校 时 的 成 绩(t=3.12,p0.05)。现在学习的是第29页,共40页方差检验(方差检验(F检验)检验)(F-test)方差检验用于检验一个变量下的三组之方差检验用于检验一个变量下的三组之间是否存在显著性差异。间是否存在显著性差
15、异。例例1:研究问题:三种词汇学习方法的效果是否有显著差异?方法1:有意学习 方法2:附带学习方法3:附带学习+有意注意例例2:研究问题:三种词汇教学方法的效果是否有显著差异?方法1:词表法 方法2:阅读法 方法3:写作法现在学习的是第30页,共40页方差分析要看计算出的方差分析要看计算出的F值和对应的值和对应的sig.值,值,或者说显著性水平。如果或者说显著性水平。如果sig.值大于值大于0.05,说,说明各组间没有显著差异,如果明各组间没有显著差异,如果sig.值小于值小于0.05,至少两组之间存在显著差异。在报,至少两组之间存在显著差异。在报告时,要报告告时,要报告F值和值和sig.值。
16、值。例:研究问题:三种不同的词汇学习方法对词汇学习是否有不同的效果?对词汇考试数据的方差分析显示,三种方法对词汇学习有不同的效果(F=12,p0.05)。现在学习的是第31页,共40页方差分析的后检验方差分析的后检验(post hoc test)l如果要检验哪两组之间存在显著性差异,可以l1)每两组之间做独立样本的t检验;l2)做方差分析的后检验,看那两组之间存在差异。现在学习的是第32页,共40页相关分析相关分析(correlation test)相关分析考察两个变量之间是否存在一定的相关分析考察两个变量之间是否存在一定的关系;如果是,这种关系有多强;而且要检关系;如果是,这种关系有多强;而
17、且要检验这种关系是否具有显著性。验这种关系是否具有显著性。例如:1)学习者二语词汇水平与阅读理解水平的关系?2)学习者二语词块知识与二语水平的关系?3)学习者二语学习动机与二语水平之间的关系?现在学习的是第33页,共40页相关分析要看计算出的相关分析要看计算出的r值和对应的值和对应的sig.值。值。如果如果sig.值大于值大于0.05,说明变量之间没有显,说明变量之间没有显著相关;如果著相关;如果sig.值小于值小于0.05,说明变量之,说明变量之间存在显著相关。在报告时,要报告间存在显著相关。在报告时,要报告r值和值和sig.值。值。例:经过统计,我们发现搭配能力与语言能力中度相关。其中,搭配能力与阅读能力相关系数为.47,显著性达到p .001;搭配能力与写作能力的相关系数为.514,显著性达到p.001;搭配能力与听力的相关系数为.443,显著性也达到p .001;搭配能力成绩与三项成绩总和的相关系数为.545,显著性达到p 0.05)。2)教龄与对影响学习效果的因素的看法之间有关系(卡方值=23.25,p=.000 0.05)。现在学习的是第38页,共40页现在学习的是第39页,共40页现在学习的是第40页,共40页