《外语教学中的统计方法幻灯片.ppt》由会员分享,可在线阅读,更多相关《外语教学中的统计方法幻灯片.ppt(40页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、外语教学中的统计方法外语教学中的统计方法第1页,共40页,编辑于2022年,星期五为什么要学习统计方法?为什么要学习统计方法?l1.统计方法给我们一种看问题的视角、分析问题的手段,使我们可以从数量的角度,分析和认识现象的特点、规律、模式、趋势或关系。l2.统计方法给我们一种精确测量的手段。例如对于“水平高”的概念,我们可以用数学计量的手段给予更精确的描述。l3.可以使我们对现象的数量表现,做出更科学的判断。l4.增强研究的自主性。数据收集的过程是自主的,对数据的处理和分析是原创的,得出的结论大大避免了抄袭的危险。第2页,共40页,编辑于2022年,星期五第一讲第一讲 基本概念基本概念1.数据类
2、型:定类数据与定距数据2.总体与样本3.误差:抽样误差与非抽样误差4.显著性与显著水平 1.不同的数据需要采用不同的统计方法;2.人们一般研究的都是样本;3.统计中误差无所不在;4.显著性反映的是研究结论的确定性。第3页,共40页,编辑于2022年,星期五数据类型之:定类数据数据类型之:定类数据 定类数据是一种分类数据。它是对观测对定类数据是一种分类数据。它是对观测对象按不同特性分类,并统计各类出现的次数象按不同特性分类,并统计各类出现的次数(频数)后得到的结果。(频数)后得到的结果。例如可以按性别、班级、课程等进行分类统计。定类测量中的类没有大小之分,只有频数高低。不能在类之间进行数学运算。
3、性别(n=50)课程(n=50)男(1)女(2)精读写作口语翻译 20 30 45 40 20 48第4页,共40页,编辑于2022年,星期五数据类型之:定距数据数据类型之:定距数据 定距数据是对测量对象按一定尺度测量定距数据是对测量对象按一定尺度测量后得出的数值。所用测量尺度有恒定的单位,后得出的数值。所用测量尺度有恒定的单位,单位之间的距离是相等的。单位之间的距离是相等的。例如对成绩、年龄等的测量通常得到的是定距数据。人们可以对定距数据进行数学运算,比较不同数值之间的大小。A班学生的期末考试成绩(n=25)66 68 69 56 77 74 57 72 74 64 80 58 68 51
4、82 72 75 63 84 78 67 71 76 75 66 第5页,共40页,编辑于2022年,星期五总体总体总体指具有相同特征或者性质的所有个体之和。总体指具有相同特征或者性质的所有个体之和。总体可大可小。例如二语学习者是大总体,某总体可大可小。例如二语学习者是大总体,某校一年级新生则是小总体。校一年级新生则是小总体。样本样本指从总体中选取的一部分个体。由于常常不能直接研究总体,所以人们常常通过样本来推断总体。样本有随机样本和非随机样本之分。第6页,共40页,编辑于2022年,星期五抽样误差抽样误差抽样误差是客观存在。只要从总体中抽抽样误差是客观存在。只要从总体中抽取样本,就会存在抽样
5、误差。取样本,就会存在抽样误差。从一个总体中抽取的样本均值与总体均值之间多数存在差异。从一个总体中抽取的不同样本均值之间也多数存在差异。为了减少抽样误差,最好用随机抽取的大样本。第7页,共40页,编辑于2022年,星期五Mean=28Mean1=25Mean2=30第8页,共40页,编辑于2022年,星期五非抽样误差非抽样误差非抽样误差是由于技术上原因,如测量工具非抽样误差是由于技术上原因,如测量工具不准,或是人为操作造成的误差。不准,或是人为操作造成的误差。比较典型的非抽样误差是考试分数合计错误,或者是数据录入失误。避免非抽样误差的方法是仔细测量和认真录入与核对。第9页,共40页,编辑于20
6、22年,星期五显著性显著性显著性的概念涉及统计分析结果的可靠性。显著显著性的概念涉及统计分析结果的可靠性。显著性检验用于验证统计结果是自然存在的还是由偶性检验用于验证统计结果是自然存在的还是由偶然因素如误差造成的。然因素如误差造成的。显著性水平显著性水平是衡量显著性的标准。在社会科学和应用语言学研究中,通常设定的显著水平为p=0.05。大于0.05的统计结果,通常说无显著差异,或无显著相关。等于/小于0.05的统计结果,通常说有显著差异,或显著相关。第10页,共40页,编辑于2022年,星期五描述统计描述统计平均值、标准差、交互表、频数表第11页,共40页,编辑于2022年,星期五平均值:所有
7、个值之和除以个值的数目。平均值:所有个值之和除以个值的数目。总体均值用总体均值用表示,表示,样样本均本均值值用用表示。表示。第12页,共40页,编辑于2022年,星期五70个学生的四级平均成绩个学生的四级平均成绩第13页,共40页,编辑于2022年,星期五标准差:是数据内部差异的一种量度。标标准差:是数据内部差异的一种量度。标准差越大,内部差异也越大。准差越大,内部差异也越大。例:两个班期末考试平均分相等,甲班的例:两个班期末考试平均分相等,甲班的标准差为标准差为5分,乙班的标准差为分,乙班的标准差为10分,说分,说明乙班的内部差异大于甲班。明乙班的内部差异大于甲班。第14页,共40页,编辑于
8、2022年,星期五70个学生四级成绩的标准差第15页,共40页,编辑于2022年,星期五Empirical Rule1 经验法则经验法则1正态分布的数据 -1 +1l大约68的数值在均值的一个标准差范围内第16页,共40页,编辑于2022年,星期五Empirical Rule2l正态分布的数据l -2 +2l大约95的数值在均值的2个标准差范围内。第17页,共40页,编辑于2022年,星期五Empirical Rule3l正态分布的数据 -3 +3l几乎全部(99.7)数值在3个标准差范围内。第18页,共40页,编辑于2022年,星期五大学英语四级考试成绩分布大学英语四级考试成绩分布均值:50
9、0 标准差:70 430 500 570l大约68的四级考试分数在430到570之间。第19页,共40页,编辑于2022年,星期五大学英语四级考试成绩分布大学英语四级考试成绩分布2l 360 500 640l大约95的考试分数在360到640之间。第20页,共40页,编辑于2022年,星期五英语四级考试成绩分布英语四级考试成绩分布 290 500 710l几乎全部(99.7)数值在290到710之间。第21页,共40页,编辑于2022年,星期五交互表交互表交互表是对定类数据的一种归纳和表现形交互表是对定类数据的一种归纳和表现形式。交互表根据行数和列数,分别有式。交互表根据行数和列数,分别有2x
10、2表表,2x3表,或者表,或者j x k表。表。焦虑成绩 正常 不正常 及格 60 7 不及格 4 30 第22页,共40页,编辑于2022年,星期五频数表频数表一种频数表是简单罗列数据中每个数值出现一种频数表是简单罗列数据中每个数值出现的次数;另一种频数表是按一定的区间,分的次数;另一种频数表是按一定的区间,分组统计和罗列数值出现的次数。组统计和罗列数值出现的次数。数值频数数值频数 55 56 58 59 60 62 6523451089 70 75 81 86 89 90 91 13 10 7 5 3 2 1数值区间频数 55-59 60-69 70-79 80-89 90-99 14 2
11、7 23 15 3第23页,共40页,编辑于2022年,星期五推断统计推断统计推断统计主要根据概率理论,利用各种推断统计主要根据概率理论,利用各种分布模型,进行组之间、变量之间的差分布模型,进行组之间、变量之间的差异或相关的显著性检验。异或相关的显著性检验。推断统计主要回答的问题是:1)不同组或不同变量的均值之间存在的差异是否显著?2)两个变量之间的相关关系是否显著?第24页,共40页,编辑于2022年,星期五常用的差异检验方法常用的差异检验方法1)独立样本的)独立样本的t检验检验2)成对样本的)成对样本的t检验检验3)一元方差分析)一元方差分析4)卡方检验)卡方检验一般情况下:1)如果数据是
12、定距数据,根据数据情况,分别采用前三种方法;2)如果数据是定类数据,采用卡方检验的方法。第25页,共40页,编辑于2022年,星期五独立样本独立样本t检验检验(independent sample t-test)独立样本独立样本t检验用于检验同一个变量下的两组数检验用于检验同一个变量下的两组数值之间是否存在显著差异。值之间是否存在显著差异。应用的研究问题:1)一次考试中的两个班的成绩是否存在显著性差异?2)一次考试中的男女生的成绩是否存在显著性差异?第26页,共40页,编辑于2022年,星期五独立样本独立样本t检验要看计算出的检验要看计算出的t值和对应的值和对应的sig.值,或者说显著性水平。
13、如果值,或者说显著性水平。如果sig.值大值大于于0.05,两组之间没有显著差异,如果,两组之间没有显著差异,如果sig.值小于值小于0.05,两组之间存在显著差异。在报,两组之间存在显著差异。在报告时,要报告告时,要报告t值和值和sig.值。值。例:独立样本t检验的结果显示,多媒体教学实验班和常规教学班(对照班)的英语水平不存在显著性差异(t=1.11,p0.05)。也就是说,多媒体教学并没有带来比常规教学更好的教学效果。第27页,共40页,编辑于2022年,星期五成对样本的成对样本的t检验检验(paired sample t-test)成对样本的成对样本的t检验用于检验就同一个变量对同一检
14、验用于检验就同一个变量对同一组对象两次收集的数据之间是否存在显著差异。组对象两次收集的数据之间是否存在显著差异。应用的研究问题:1)某年级学生进校时英语水平和现在英语水平之间是否存在显著差异?2)某级学生经过一年的学习后,学习动机是否发生了改变?第28页,共40页,编辑于2022年,星期五成对样本成对样本t检验也看计算出的检验也看计算出的t值和对应的值和对应的sig.值,或者说显著性水平。如果值,或者说显著性水平。如果sig.值大于值大于0.05,成对样本没有显著差异,如果,成对样本没有显著差异,如果sig.值小于值小于0.05,样本之间存在显著差异。在报告时,样本之间存在显著差异。在报告时,
15、要报告要报告t值和值和sig.值。值。例:成对样本t检验的结果显示,某年级新生进校后经过一段时间的学习,成绩有了显著提高,第二次考试成绩显著高于进校时的成绩(t=3.12,p0.05)。第29页,共40页,编辑于2022年,星期五方差检验(方差检验(F检验)检验)(F-test)方差检验用于检验一个变量下的三组之间方差检验用于检验一个变量下的三组之间是否存在显著性差异。是否存在显著性差异。例例1:研究问题:三种词汇学习方法的效果是否有显著差异?方法1:有意学习 方法2:附带学习方法3:附带学习+有意注意例例2:研究问题:三种词汇教学方法的效果是否有显著差异?方法1:词表法 方法2:阅读法 方法
16、3:写作法第30页,共40页,编辑于2022年,星期五方差分析要看计算出的方差分析要看计算出的F值和对应的值和对应的sig.值,值,或者说显著性水平。如果或者说显著性水平。如果sig.值大于值大于0.05,说,说明各组间没有显著差异,如果明各组间没有显著差异,如果sig.值小于值小于0.05,至少两组之间存在显著差异。在报,至少两组之间存在显著差异。在报告时,要报告告时,要报告F值和值和sig.值。值。例:研究问题:三种不同的词汇学习方法对词汇学习是否有不同的效果?对词汇考试数据的方差分析显示,三种方法对词汇学习有不同的效果(F=12,p0.05)。第31页,共40页,编辑于2022年,星期五
17、方差分析的后检验方差分析的后检验(post hoc test)l如果要检验哪两组之间存在显著性差异,可以l1)每两组之间做独立样本的t检验;l2)做方差分析的后检验,看那两组之间存在差异。第32页,共40页,编辑于2022年,星期五相关分析相关分析(correlation test)相关分析考察两个变量之间是否存在一定的相关分析考察两个变量之间是否存在一定的关系;如果是,这种关系有多强;而且要检关系;如果是,这种关系有多强;而且要检验这种关系是否具有显著性。验这种关系是否具有显著性。例如:1)学习者二语词汇水平与阅读理解水平的关系?2)学习者二语词块知识与二语水平的关系?3)学习者二语学习动机
18、与二语水平之间的关系?第33页,共40页,编辑于2022年,星期五相关分析要看计算出的相关分析要看计算出的r值和对应的值和对应的sig.值。值。如果如果sig.值大于值大于0.05,说明变量之间没有显著,说明变量之间没有显著相关;如果相关;如果sig.值小于值小于0.05,说明变量之间,说明变量之间存在显著相关。在报告时,要报告存在显著相关。在报告时,要报告r值和值和sig.值。值。例:经过统计,我们发现搭配能力与语言能力中度相关。其中,搭配能力与阅读能力相关系数为.47,显著性达到p .001;搭配能力与写作能力的相关系数为.514,显著性达到p.001;搭配能力与听力的相关系数为.443,显著性也达到p .001;搭配能力成绩与三项成绩总和的相关系数为.545,显著性达到p 0.05)。2)教龄与对影响学习效果的因素的看法之间有关系(卡方值=23.25,p=.000 0.05)。第38页,共40页,编辑于2022年,星期五第39页,共40页,编辑于2022年,星期五第40页,共40页,编辑于2022年,星期五