《教育测量概述.ppt》由会员分享,可在线阅读,更多相关《教育测量概述.ppt(41页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、教育测量概述现在学习的是第1页,共41页第一节 教育测量的含义与特点一、教育测量的含义 教育测量是根据教育目标的要求,按照一定的规则对教育活动的效果加以数量化测定的过程。它主要用于对学生精神特性的测定。由于教育测量主要是对学生精神特性的测定,对学生精神特性的测定比对物体的物理特性的测定要因难得多,主要原因在于学生精神时刻在发生变化不易控制,而物体物理特性的测定无论在单位上还是在稳定性上都比对学生精神特性的测定优越得多。所以,教育测量与物质测量有着根本的区别教育测量有它自己独具的特点。现在学习的是第2页,共41页二、教育测量的特点(一)教育测量具有间接性 教育测量所要测量的对象是学生对知识的理解
2、程度、智力发展水平及才能等,这些都是不易触及的心理品质。因此,教育测量主要用于学生精神特性的测定,即不能直接测量人的心理实体。对学生精神特性的测定,只能通过教育影响使学生从行为上表现出来,或根据学生对测验题目的反应,运用推理和判断的方法去间接测定这些行为属性。正因为教育测旦是间接的,这就大大增加了测量工作的难度。因为,在测量过程中必然会受到许多无关因素的影响,产生测量误差,影响测量结果的准确性。再就是对测量内容的界定比较困难。因此,要求测量者在编制测量和实施测旦时采取谨慎的态度,结合有关专业知识科学进行。现在学习的是第3页,共41页(二)教育测量具有不确定性 教育测量的不确定性是指教育测量所使
3、用的工具的单位和标准是相对的。教育测量不同于物理测量,在一般情况下物理测量的度量单位是比较稳定的,也是较确定的。教育测量的不确定性表现在三个方面:第一,测量尺度的相异性。即对于教育测量来说,对同一被试的测量,不同的测评者使用的尺度不一样必然使测量产生误差因而影响测量的准确性。第二,教育测量活动的不易复验性。即对于教育测量来说,由于工具的抽象性和不稳定性,因而很难再次使用尺度对先前的测量进行检验,这是由影响教育测量的多因素决定的。第三,测量单位的相对性。即在教育测量中测验分数的价值是相对的。一方面,由于试题的难易度不同,评分标准不同,班上学生成绩的分布情况不同,因此,不同班级学生的考试分数以及不
4、同试题的考生分数价值并不相等;另一方面,同一试题的考生分数,如59分比60分少1分98分比99分少1分,这两个相差的1分,并不是由相等的标猴来确定的,因此,单位是相对的。现在学习的是第4页,共41页(三)教育测量具有明确的目的性 教育测量既是检验教育教学成败的重要工具,又是改进教育工作,提高教育质旦的保证。因此,教育测量的内容、难度、实施程序等都必须根据教育目的的要求,以教学大纲和教材内容为依据来制定。教育测旦的员终目的是为了掌握学生在学业、智力和思想品质等方面的情况了解教育和教学的效果,以便合理地组织教育活动,安排教学内容,改进教学方法,贯彻因材施教,从而促进学生的全面发展。那种不顾教育目的
5、的要求,为测量而测量的做法,是不符合教育测量的要求的。因此,这更加显现厂教育测旦的严肃性。由此可见,学生的学业成绩、学习能力及思想品德等方面是可以测量的,但由于教育测量具有间接性、不稳定性以及为教育目的的服务性,就要求教育测量者必须了解测量的方法和编制技术,掌握测量工具的科学使用方法和策赂。现在学习的是第5页,共41页第二节 教育测量的发展史 教育测量源远流长。国内外不少学者认为,教育测量起源于我国的科举考试制度,至今已有几千年的历史。虽然教育测量起源于我国,但由于种种原因,我国的教育测量未能得到很好的发展。而在西方,尤其是美国,19世纪以后在教育测量方面的研究得到迅速的发展。他们的理论和方法
6、,对世界各国产生了重要影响,对我国也有不少可借鉴之处。现在学习的是第6页,共41页一、主观经验性考试阶段 1864年以前是主观经验性考试阶段。在很久以前、西方各国学校广泛采用的考试方法是口试,对学生逐个进行口试,以评定学生的知识程度。后来学生日渐增多、这种口试方法显然对大批学生的评定带来困难。公元606年即隋炀帝大业二年我国开始实行科举考试制度,通过分科考试来选取人才,采用贴经、墨义、策问、诗赋等方法去测试学生这对西方产生很大影响。欧洲学校的笔试开始于1702年英国的剑桥大学,1845年美国麻省波斯顿市教育委员会开始采用笔记的方法考查该市所属学校的毕业生。以后,西方各国相继采用笔试来测评学生的
7、成绩和能力。主观经验性考试阶段,由于试题所覆盖的知识面窄,教师可以根据自己的知识、经验、爱好等进行评分,不能保证评分的客观性,因而这一阶段的测量不是科学的教育测量。现在学习的是第7页,共41页二、客观标准化测验阶段 1864年,英国格林威治医学院教师乔治费舍(Fisher Ceorge)收集了许多学生的成绩汇编成量表集一书,试图提供一个可以度量学生各科成绩的参考标准。该书中列有评定各科成绩的等级,评定学生成绩时:可将学生成绩与量表上的样本等级相对照,以确定学生成绩的等第。这可以说是客观标准化测量的萌芽,使教育测量走上了客观标推化测验。所谓客观标准化测验是指以一定的目的为依据,编制具有代表性的测
8、验量表给出标准答案、评分标准,以及标明测验常模(即年龄或年级测验平均分),用以衡量被试的所得成绩和地位。现在学习的是第8页,共41页三、客观测验的深入发展阶段 随着教育测验运动的发展,教育测量也暴露出一些弱点。30年代,美国进步主义教育联盟(Progressive Education Asociation简称PEA)的一些教育专家认为,教育测量虽然可使考试客观化、标准化,但对学生的社会态度、兴趣、品德、性格等不能全部把握测量的准确性,需要进一步改革。因此在PEA会长艾钦(wMAikin)为首的领导下,由泰勒(RwTyler)等教授组成了研究委员会,进行了历时8年之久的实验研究,称之为“八年研究
9、”(1933年一1940年)。其主要目的是研究全面发展人的才能,提出了一套以教育目标为核心的课程和测验的编制原则,并悉心设计了一套教育评价法,把所有能够用来考查效果的方法综合起来,以评鉴教育是否实现全部目标,从而推动了教育测量的深入发展。现在学习的是第9页,共41页 美国的教育测量有了新的发展,主要表现在;教育测量由原来对学生知识的测量发展到重视对学生思想品德的测量;由原来对学生学习成绩的测量发展到对教育教学改革方案等效益方面的测量;由原来的一双“常模参照性测验”,即根据所得分数的常模,来进行考生之间的分数比较,以选拔人才,发展到选用“目标参照性测验”。由于这种测验是根据学生答对试题的比例来判
10、断学生达到教育目标的程度,因而在确定学生是否完成学习任务,能否升级、毕业等方面被广泛地应用。美国等西方国家还出现了许多从事测量研究工作的专业组织机构,最著名的有美国教育测验服务社它成立于1947年,主要举办高等学校入学考试(SAT)、研究生资格考试(GRE)和“作为外语的英语测验”即“托福”(TOEFL)考试。另外还设计各种职业性考试,根据用人单位的需要临时设计各种考试,如会计、医生、律师等行业,都运用教育测量来选拔人才、分配工作和鉴定工作效率。现在学习的是第10页,共41页 在我国,1917年以后也开始了教育测量的研究,俞子夷曾编写了小学国文毛笔书法量表、小学算术应用题测验等,此外,还有陈鹤
11、琴和廖世承编制的英文、常识、历史、地理以及混合理科测验等。在这一时期,各科测验的编制规则、施测步骤、评分及统计分析方法都有较详细的规定。特别是党的十一届三中全会以来,我国的教育测量得到了很大发展许多同志从事这方面向题的研究,如林传鼎、张厚灿等编制了少年儿童学习能力测验,中国科学院心理研究所修订了多项性格记录表,吴天敏修订了斯坦福Bs量表以及华东师范大学等单位开展了“初中平面几何学业成绩测定”的研究等等,目前我国有关教育测量的研究,正在生机勃勃地向前发展。现在学习的是第11页,共41页第三节 教育测量的要素和种类一、教育测量的要素(一)参照点 参照点是计算事物数量的起点,又称零点。零点有两种:一
12、种是绝对零点,如各种度量衡器上的零点,另一种是相对零点,是人定的零点,如温度的测量以冰点作为零点。在教育测量中,所使用的参照点几乎都采用人定的相对零点。人定的零点的最大限制是不能以倍数的方式解释分数。例如,有两件物品,一件重50KG,另一件重100 KG,可以说,重100 KG的物品是重50 KG物品的2倍。而在教育测量中,甲学生的智商是100,乙学生的智商是50,我们不能说甲学生的智力是乙学生智力的2倍,因为没有真正的零智力的学生。同样甲学生的学科成绩是100分,乙学生的学科成绩是50分,我们不能说甲学生的成绩是乙学生成绩的2倍。这是我们在解释教育测量分数时,必须注意的问题。现在学习的是第1
13、2页,共41页(二)单位 物理测量的单位比较明显,如长度以米、厘米等为单位,重量以牛为单位,时间以月、小时等为单位,缺少单位,数量的多少就无法表示,数量分析也就无从进行。好的测量就必须具有好的单位。一个好的测量单位必须具备两个条件:一是有明确的意义,即同一单位在人们的心目中有同样的意义;二是有相等的价值,即单位与单位之间距离要相等。物理测量所使用的单位容易符合这两个条件,而教育测量使用的单位严格地讲不符合这两个条件。如以百分制为单位测量学生学习成绩,50分与51分之间价值差异不等同于99分与100分之间的价值差异。当然,教育测量必须具有单位,我们应当尽量改进教育测量的单位,使之科学化。现在学习
14、的是第13页,共41页(三)量表 量表是参照点和单位的连续载体。它是测量的工具,是表示数量的方法。如天平是权衡质量的量表,尺于是度量长短的量表,而教育测量则是以文字试题、图形、符号、操作等方式来测量学生的学业成就、智力和思想品德等方面的发展水平。在教育测量中所使用的量表有四种类型,即称名量表、顺序量表、等距量表和比率量表。现在学习的是第14页,共41页 1称名量表 称名量表是一种最低水平的量表,这种量表与事物的分类相联系。它是用一定的数字对事物的类别加以标识。例如,用“l”和“o”分别表示男女学生在标识上的区别。用“1”和“o”分别表示电位器上的高电位与低电位等。这种数字只起到某种名称符号的标
15、识作用,它只是对事物的属性进行归类以示区别,并没有高低序列的意思,更没有可加性,不能参与任何运算。运用称名量表,可以对各类别的频数进行累计,如计算参加测验的学生,有多少男生多少女生。对称名量表可运用的统计方法都属于对频数的统计处理。如百分比。现在学习的是第15页,共41页2顺序量表 顺序量表是表示事物相对关系(如顺序关系)的数值特征的量表。如学生学业成绩的名次可分为第一名、第二名、第三名等等;又如学生思想品德的等级,可用优、良、中、及格和不及格五个等级表示。顺序量表优于称名量表,因为它既能对事物进行分类,又能标志各类别之间的顺序关系。但顺序量表也存在缺点,因为它不能说明每一等级之差是否有相等的
16、距离没有表明测量单位的大小。因此,顺序量表不具有等距性,不能进行加减乘除的运算。但这种量表在教育测量中应用较广,如百分量表即属此种量表。教育测量应用顺序量表进行统计处理的方法主要有,中位数、百分位数、等级相关系数等。现在学习的是第16页,共41页 3等距量表 等距量表最显著的特点是等距性,它对事物所作的数量划分是等距离的,是确定的,所以,它是比称名量表和顺序量表较高一级的量表。如物理测量中的温度,用摄氏量表的刻度将冰水混合物的温度定为o度,1.01105kPa下沸水的湿度定为100度,其间作100等分,这样就以摄氏度为单位可以比较温度之间的差异了,而且这种量表上所表示的数值就可以进行加减运算,
17、如可以求平均温度。由于等距量表没有绝对零点,它的零点是人定的,因此用等距量表表示的数值虽可以作加减运算,但不能用倍数关系表示,不能进行乘除运算。等距量表虽有一些缺点,但在教育测旦量中却有实用意义。因为教育测量的结果都可以转化为等距量表进行比较,可以将原始测验分数转化为标准分数进而可以将各种测验得到的不同单位的分数转换到同一等距量表上进行分析比较。等距量表在统计分析和处理时,应用比较广泛,许多统计方法都可运用。如计算平均数、差异量、相关系数等统计量,还可以运用z检验、t检验、F检验等进行统计推断;现在学习的是第17页,共41页4、比率量表 比率量表是测量中最高水平的量表。它既有绝对零点,又有相等
18、的单位,因此,可以进行加减乘除运算。比率量表在物理测量中被广泛运用,但在教育测量中运用较少。因为它的条件极强,教育调量中的各种分数不易满足这一条件。现在学习的是第18页,共41页二、教育测量的种类(一)根据测验的目标分为学业成就测验、智力测验、能力倾向测验与人格测验。1学业成就测验 学业成就测验即学生学习效果的测验,是关于教学目标的考试。学业成就测验有比较明确的范围,它不仅是知识的测量,也包括技能的测量。学校平时组织的课堂考试,期中、期末考试,毕业考试等都是成就考试。它也可分为学科测验和综合测验。前者是测量学生掌握菜学科的知识、技能情况,加数学、语文、物理等测验;后者是指多种学科的知识技能的综
19、合测验。现在学习的是第19页,共41页2、智力测验 智力测验主要测量学生的智力高低。测验范围包括学生的观察力、记忆力、想象力、判断力、创造力等。常用的工具有比纳西蒙智力量表、斯坦福比纳量表、韦克斯勒儿童智力量表、韦克斯勒成人智力量表及我国陆志伟和吴天敏修订的比纳智力量表等标准智力测验量表。现在学习的是第20页,共41页3能力倾向测验 能力倾向测验用于测量学生的特殊才能。如美术、音乐、体育等特殊能力测验。这类测验的目的在于深入了解学生某方面的特长和发展倾向。现在学习的是第21页,共41页 4、人格测验和个性倾向性测验 人格测验主要用于测量性格、气质、兴趣、情绪、动机等方面的个性心理特征和个性倾向
20、性,也即对个性中除能力以外的部分进行测验。现在学习的是第22页,共41页(二)根据测验的时机分为准备性测验、进展性测验、总结性测验1准备性测验 准备性测验是指在进行某一学习活动之前进行的、用来测量学生对于完成某一学习任务或胜任某一工作的准备情况的测验。也就是测量学生是否具有完成某一学习或工作任务的最低知识和能力。如学习教育统计学之前,需先测验学生必要的数学知识;学习教育测量学之前,可先测验学生的统计学知识等。如果学生缺乏必备的知识技能,就要采取适当的补救措施。现在学习的是第23页,共41页 2进展性测验 进展性测验是指在教学进程中实施的测验。进展性测验又叫形成性测验。用以测量学生目前达到学习目
21、标的程度和学习情况。它是教学的中间环节,它特别强调单元教学所要达到的学习结果,测验题目紧扣教学内容,目的在于考查学生学习是否成功。教学中进行的单元测验就是进展性测验。现在学习的是第24页,共41页3总结性测验 总结性测验是在教学结束时进行的测验。其目的是为了了解学生在学习活动后的知识、技能、思想、体力和心理等方面的发展情况。如期中、期末、毕业考试均属此类测验。现在学习的是第25页,共41页(三)根据测验结果的评价标准分为常模参照测验、目标参照测验1、常模参照测验 常模参照测验是以已建立的常模为标准,衡量学生在特定团体中的相对位置,并以此来解释分数的意义的测验。所谓常模,它是各个人之间进行比较的
22、标准。某科的常模就是指确定的某团体在该科考试中的平均水平,如平均数和标淮差。常模参照测验的主要目的是把测验分数作横向比较,即某考生成绩和其他考生成绩比较,决定该生地位。升学考试属于此类测验。现在学习的是第26页,共41页2、目标参照测验 目标参照测验是测量学生掌握的知识和测量目标的关系,是根据原来确定的希望达到的教学目标来解释分数的测验。目标参照测验着眼于所有教学目标的完成情况,它的特点是强调测验紧扣目标。如单元教学之前、中间或结束时进行的测验,都属于目标参照测验。现在学习的是第27页,共41页(四)根据测验材料分为文字测验、非文字测验 1文字测验 凡以文字材料编制的测试内容,并以文字作答的测
23、验,统称文字测验。此种测验只适用于懂得文字的人。测验的编制和实施都较容易,因此应用范围较大,团体测验多数采用的是文字测验。2非文字测验 非文字测验指以非文字材料如用图形、仪器、工具或实物等编制的测验。学生回答时用非文字的方式表示,如以操作、记号或作业等活动来进行。这种测验既适用于不懂文字的人,也适用于懂文字的人用途较广。现在学习的是第28页,共41页(五)根据测验来源分为标准化测验、自编测验 1标准化测验 这种测验是由权威性的机构和学科专家及考试专家组成的命题委员会负责组织、编制、主持的,它有客观而规范的标准,从命题、施测、阅卷到评分的各个环节都有严格规定与要求,以尽量减少各种误差,从而使考生
24、的成绩得到较其实地反映。2自编测验 它是由教师自己编制的测验,一般学校在较小范围内考查学生学习成绩时所进行的各种测验,如班级的单元测验、期中测验、期末测验等均属于教师自编测验。现在学习的是第29页,共41页(六)根据测验的对象分为个别测验、团体测验 1、个别测验 这种测验是由个主试在规定的时间内每次只测验一个被试。其优点是主试者可以仔细观察被试者的言语、情绪和行为,易于与被试合作,所以测验结果正确明。这类测验的缺点是不经济,且必须是经过专业训练者才能胜任。如外语口试测验、音乐表演测验以及心理特征的测验等。2团体测验 这种测验是用相同的测试内容、在同一时间内对许多人施测。例如,毕业考试、统考都属
25、于团体测验。它的优点是,主试者不必接受严格的专业训练即可担任,而且节约时间。它的缺点是,对被试的行为不易作切实地观察与控制,测验的结果不及个别测验正确可靠。现在学习的是第30页,共41页 总之,教育测量的类型很多,可以从不同角度划分,分类的方法也不统一,同一个测验按不同的划分方式,也可分为不同的类型,因此分类是相对的。但要注意,由于测验的编制者给要测量的特征下的定义(操作性定义)不一样因而在区别测验时不能只看名称应主要看编制者的目的和测验的实际内容。现在学习的是第31页,共41页第四节 教育测量的功能 明确的教育目的,科学的教育内容和方法,教育效果的及时检查与评定,是搞好教育工作的三个主要问题
26、。教育测量就是根据教育目标及教学计划的要求用科学的方法来衡量教学的效果。因此,教育测量在整个教学中占有重要地位,它在教学、行政管理、科研等方面的应用极为广泛。现在学习的是第32页,共41页一、教育测量在教学方面的功能 可以用测验结果来考查某一种学习活动的效果,并用数量表示结果,这为我们提供了认识影响教学过程各因素的客观依据。具体地讲,教育测量在教学方面具有以下一些功能。(一)反馈功能 在教学之前、教学过程中、教学结束时进行的各种不同目的的考试,可为教师修改教学计划,了解学生对教学目标的完成情况提供可靠的依据。通过测验,教师可以发现教学中存在的问题,还可以分辨学生的程度,以便有针对性地采取补救措
27、施,促进教学效果不断提高。现在学习的是第33页,共41页(二)激励功能 教育测量可促使学生了解和确认自己的成效,从而不断端正动机,弥补不足,激发上进心。他们通过了解自己的学习成绩,会激发更强的成就动机,发挥更大的积极性;也会看到自己的缺陷和不足,以此鞭策自己,激发自己努力工作或刻苦用功以避免失败的动机。现在学习的是第34页,共41页二、教育测量在行政管理方面的功能 教育测量是教育评价的基础它能够为制定教育计划、选择教育内容、确定教育方法、检验评定教师的教育教学效果、检查鉴定学生的发展水平以及评价学校的办学质量提供客观的依据。(一)评价功能 编制良好的测验,可为教育行政领导指导教学、进行教育决策
28、提供一定的依据。各级领导可凭借全国或地区的常模,评价某区或某校的教学情况,学校领导也可通过考试结果检查教师的工作。(二)选择功能 教育测量能够为教育行政管理干部评定和选拔人才并作出科学决策提供理论依据也有助于教师的资格评定和职务的晋升等。现在学习的是第35页,共41页三、教育测量在教育科学研究方面的功能 (一)导向功能 各级各类学校都要实现国家规定的培养目标,教育测量对学校实现培养目标具有明显的导向作用,它能对学校教育教学改革定向导航,并提供动力保证。(二)研究功能 教育测量的结果具有极大的研究价值,它是在教育改革实验中检验其成效的必要环节和基本手段。而且,教育测量本身就是一种严肃的科学探讨。
29、现在学习的是第36页,共41页第五节 良好测验的特征 教育测验是教育测量的主要手段。在编制或选用测验时,应慎重考虑它是否符合良好测验的条件。良好测验的条件通过良好测验所具有的特征反映出来。现在学习的是第37页,共41页一、可靠性(信度)测验的可靠性是指测验能否稳定反映考生实际水平的程度。如果某生在连续两次或多次测验中所得结果相一致,或在某一班级的两次或多次测验的得分很接近、很稳定,其测验结果的相关度很高这种测验可称为可靠性的测验或称为信度高的测验。测验的可靠性是用信度来表示的。信度一般用两次测验同一对象的分数的相关系数表示。根据计算方法,可将信度分为再测信度、复本信度、内部一致性信度和评分者信
30、度等。信度是良好测验的必要条件,但不是充分条件。一个测验只具有可靠性还不行,还必须具备有效性。现在学习的是第38页,共41页二、有效性(效度)测验的有效性是指测验能确实地测量出所要测量的特性的程度。它是为特定的目的服务的。测验如果有效性低,就无价值可言。例如,数学测验的目的是为了测量被试的数学成绩,如果考生在数学测验中得了低分,是由于试题的文字表述过于深难而妨碍了考生正确理解题意造成的,这个测验并没有测量到考生的数学水平,而是测量了学生的阅读能力,这表明该测验的有效性是不高的,没有达到测验的目的。测验的有效性是用效度来表示的。效度总是与测验目标密切相关的,因此,根据测验目的可以把效度分为内容效
31、度、构想效度和效标关联效度。内容效度是指测验内容或题目代表所测对象范围的程度,它通常用于衡量学科成绩测验;构想效度是指测量分数能够描述个人所具有的心理品质和能力的程度,它主要适用于心理测验;效标关联效度是指测验分数与外在参照标准(亦称效标)的相关程度,它可以分为同时效度和预测效度,前者适用于以评定现状为目的的测验,后者适用于预测测验,目的在于研究该测验预测未来成就的预测程度。现在学习的是第39页,共41页 三、难易性(难度)与鉴别性(区分度)测验的难易性是指试题的难易程度,亦称难度。测验难度对测验在多方面的质量产生深刻影响。测验的鉴别性是指测验对不同水平的考生能鉴别其水平高低的程度。测验的鉴别
32、性可以用测验中项目的区分度来表示,它与项目的难度有关。测验项目要有区分度,则难度必须要适中,过难或过易区分度都较低。同样,区分度又影响测验的效度,它是保证测验具有较高效度的重要条件。如果一个测验使优生和差生得到同样或相近的分数,便说明测验无区分度或区分度较低,那么,这个测验的效度也较低。因此,难易性与鉴别性都是良好测验的重要特征现在学习的是第40页,共41页 四、实用性 测验的实用性是指测验要宜于实施、易于评分、便于解释,在人力、时间和费用上要符合节约原则。测验的实用性还必须使测验标准化。而且为了应用方便,良好测验应备有复份。复份必须保证在测验的内容范围、难度、题型和数量等方面要相似。复份便于我们对测验结果进行复查,也保证了题库的丰富性。因此,一个良好的测验至少需有两份复本的测验,便于我们灵活应用。现在学习的是第41页,共41页