《中小学教育测量与评价PPT讲稿.ppt》由会员分享,可在线阅读,更多相关《中小学教育测量与评价PPT讲稿.ppt(30页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、中小学教育测量与评价第1页,共30页,编辑于2022年,星期三目录中小学教育测验的编制中小学教育测验的成绩分析中小学教育测验的评价第2页,共30页,编辑于2022年,星期三一、教育测验的编制是非题是非题举例:人民行使国家权力的机关是全国人民代表大会及地方人民代表大会。()常见的考试试题类型题意:意义完整,概念明确,逻辑清晰,不含线索,陈述为主第3页,共30页,编辑于2022年,星期三教育测验的编制常见的考试试题类型因果式选择题举例:感性认识有待于发展到理性认识,这是因为感性认识只反映个别事物的表面现象,只有理性认识才揭示事物的本质和规律,才是对事物更深刻更全面、更可靠的反映。()A结果与原因都
2、正确B结果正确原因不正确C原因正确结果不正确D结果与原因都不正确 选择题选择题肯定式选择题举例:三国演义的作者是()。A曹雪芹 B吴敬梓 C罗贯中 D蒲松龄选择题选择题否定式选择题举例:下面五种东西中哪个与其他最不相似()。A麦子B稻草C大豆 D玉米F高粱选择题选择题题干:意义完整,界定明确,概念一致,不含线索选项:彼此互斥,类型同质,简洁明确,编号唯一第4页,共30页,编辑于2022年,星期三教育测验的编制常见的考试试题类型改错式选择题举例:“我国发射第一枚运载火箭的活动获得圆满成功。”其中的“活动”一词可以替换为下面的()A工作 B试验 C作法 D愿望选择题选择题类推式选择题举例:如果甲比
3、乙高,乙比丙高,那么甲肯定比丙高。()A真 B假 C 不肯定选择题选择题组合式选择题举例:在第一次世界大战末期和战后的革命高潮中崩溃的帝国有()。A(123)B(13)C(24)D(1234)1德意志 2俄罗斯 3奥匈 4奥斯曼 选择题选择题第5页,共30页,编辑于2022年,星期三教育测验的编制序列式选择题举例:(1)唯见长江天际流;(2)烟花三月下扬州;(3)孤帆远影碧空尽;(4)故人西辞黄鹤楼这四句诗的顺序是()A()B()C()D()选择题选择题常见的考试试题类型配合式选择题举例:从下面左列姓名中给右面每篇文学作品找出作者。夏衍 祝福鲁迅 四世同堂杨沫 青春之歌老舍 包身工 选择题选择
4、题分类式选择题举例:下面四组作品中,从文学知识角度看,哪一个与其他三个不同。()A水浒传B西游记C红楼梦D聊斋志异选择题选择题第6页,共30页,编辑于2022年,星期三教育测验的编制举例:我国人民行使国家权力的机关是全国人民代表大会以及 。填空题填空题举例:我国西部地区主要有哪些气候类型?常见的考试试题类型简答题简答题举例:举例说明在工业产品设计中应用工效学的基本原理的重要性。论述题论述题空白:概念完整,不含语法,前后一致,无其它可能性题干:意义明确,界定清晰,包含线索或诱导成分,陈述疑问方式均可题干:意义完整,界定明确,概念一致,不含线索题干:表述完整,包含理论关键词及答题要求关键词,前后呼
5、应,含诱导成分第7页,共30页,编辑于2022年,星期三教育测验的编制题目选择 题量控制设计试题的注意事项独立性原则独立性原则有效性原则有效性原则编写格式的统一性原则编写格式的统一性原则统计指标的适合性原则统计指标的适合性原则文字表述准确性原则文字表述准确性原则内容的典型性原则内容的典型性原则赋分的合理性原则赋分的合理性原则测验的时间测验的时间试题的题型试题的题型计算与文字书写量计算与文字书写量试题的难度试题的难度考核内容覆盖面考核内容覆盖面测验的性质测验的性质 第8页,共30页,编辑于2022年,星期三项目评价难度难度指标适用范围指标适用范围计算公式计算公式难度难度是指测验项目的难易程度,试
6、题的难度可以用试题的通过率来表示。试题卷面的难度值范围是0.60.7难度记为 P,在教育测量中,PR/NR:答对该题的人数N:参加测验总人数 第9页,共30页,编辑于2022年,星期三项目评价含义意义公式指标范围区分度指测验对学业水平不同的考生的区分程度或鉴别力。具有良好区分度的项目,能将不同水平的考生区分开来,即在该项目上水平高的考生得高分,水平低的考生得低分。区分度区分度通常用D表示,取值范围为1.00至-1.00。D越高则质量越好。0.2以下应淘汰0.2-0.3 合格0.3-0.4 良好0.4-1 性能佳 DPHPL第10页,共30页,编辑于2022年,星期三项目评价客观性试题客观性试题
7、极端分组法极端分组法区分度公式 DPHPL计算步骤:按测验总分从高到低排序;测验总分最高的27的被试作为高分组,最低的27的被试为低分组;分别求出这两组被试通过试题的百分比;将算得有关数据带入上公式。区分度计算区分度计算公式XH:高分组总分;XL:低分组总分;H:该题最高分;L:该题最低分;N:考生总人数的25计算步骤:按测验总分由高到低排序;分别确定测验总分的前27和后27作为高低分组;列出试题分析表;将数据带入公式计算。主观性试题主观性试题极端分组法极端分组法第11页,共30页,编辑于2022年,星期三项目评价整体分析:信度即测试的稳定性和和可靠程度,信度是反映测量中随机误差大小的指标。包
8、括重测信度、复本信度、同质性信度。重测信度:同一测验对同组被试先后两次施测所得结果的一致性程度;复本信度:两平行测验对同组被试施测所得结果的一致性程度;同质性信度:测验内部所有题目间的一致性程度。信度信度教师自编测验的信度指标范围为0.7以上。含义含义种类种类指标范围指标范围第12页,共30页,编辑于2022年,星期三项目评价整体分析:效度是测验的准确性,是测验能够测出它所欲测的特质的程度,即测验实际测量出其所要测量特性的程度。内容效度:是指测验内容对于其所欲测之行为领域的代表性程度。效标关联效度:是指一个测验对处于特定情境中的个体的行为进行预测的有效性。结构效度:是指测验对于被称作某一理论概
9、念或特质测量的程度。效度效度教师自编测验的效度指标范围为0.4以上。含义含义种类种类指标范围指标范围第13页,共30页,编辑于2022年,星期三项目评价测验中题目的数量应测验中题目的数量应适当,不能太少适当,不能太少 紧密围绕教学大纲和紧密围绕教学大纲和教学目标命题教学目标命题 考核内容应全面,并能有效代考核内容应全面,并能有效代表学生应掌握的知识领域表学生应掌握的知识领域 少出偏题怪题,以考察基础知少出偏题怪题,以考察基础知识基本能力为主识基本能力为主 测验整体难度适当,不同类型、不同测验整体难度适当,不同类型、不同难度的题目应保持恰当比例难度的题目应保持恰当比例 提高信度和效度提高信度和效
10、度的方法的方法 信度和效度第14页,共30页,编辑于2022年,星期三成绩分析原始分原始分误区误区家长看到孩子成绩单上的数学测验成绩为82分,语文测验成绩为70分,父母们对此是如何评价的?某学校负责人在学期结束时的总结会上对某学科教师说他的教学效果不好,其依据是该学期学生在此学科上的考试平均成绩低于其他学科。有老师对学生说,你上次数学测验的的成绩是78分,这一次测验只得了71分,你为什么退步了。原始分数的误区第15页,共30页,编辑于2022年,星期三成绩分析数据的整理在获得数据之后,要对数据分门别类,加以整理。数据的整理了分析数据的第一步,分类的标准与分析的目的直接相关。比如,对学生成绩进行
11、初步分析,可以以性别和成绩水平为类别标准,用一个统计表表示不同成绩组中数据的个数。甲班男女生数学成绩分布统计表 566162113合计232984女3347139男差中良优合计成 绩性别乙班学生数学成绩分数段统计表 5901580-891570-79760-69160人数分数段第16页,共30页,编辑于2022年,星期三成绩分析数据的整理次数直方图次数直方图由若干直方条排列在基线上构成,直方条的高度或长度表示次数大小。第17页,共30页,编辑于2022年,星期三成绩分析数据的整理次数多边形图次数多边形图以各组的组值为横坐标,以相应的次数为纵坐标画点,然后将这些点连接成折线。第18页,共30页,
12、编辑于2022年,星期三成绩分析数据的整理分数分布形态图数据的往往表现出不同的分布模式,一般来说,学生的成绩分布为正态或负偏态分布。正态分布是最为常见一种概率分布形态,在理论和实践中均有广泛的应用,具有单峰和对称的特点。第19页,共30页,编辑于2022年,星期三成绩分析通用符号含义:所有观察值Xi的总和除以总个(次)数所得之商。简称平均数或均数。一个数据发生任何微小的变化都会影响到算术平均数的大小,算术平均数能够非常灵敏地反映数据的变动。一些极端数值(极大值或极小值)很容易影响平均数,使其失去典型性。基本统计量及其含义算术平均数意义:算术平均数是一组观察值的代表值,在平均过程中,它可以消除由
13、于偶然性造成的差异,从而揭示出必然因素的作用。有了它,我们就可以对不同的总体或同一总体不同时间的情况进行比较,判断它们之间的差异。第20页,共30页,编辑于2022年,星期三成绩分析通用符号含义:把全部数值按大小顺序排列,位于中间位置的数。基本统计量及其含义中数意义:所有数据中,只有位于最中间的1个或2个数据参加运算,极端数值不会影响中数。它适合用于代表有极端数据的一组数值,但不适合进行进一步的代数运算。第21页,共30页,编辑于2022年,星期三成绩分析通用符号含义:是数据中出现次数最多的那个数值。将所有数据依大小顺序排列,然后用观察法直接寻找一组数据中出现次数最多的那个数,就得到众数。基本
14、统计量及其含义众数意义:众数简明易懂,也不受极端数值的影响,数据分组中组距对众数有直接的影响,也不适合进一步的代数运算,其使用范围十分狭窄。第22页,共30页,编辑于2022年,星期三成绩分析计算公式含义:是观察值中最大值与最小值的差。基本统计量及其含义全距意义:全距是最粗略的差异量,全距越大说明观察值越分散,反之就越集中。全距的计算只使用了两个数据,所以它易受极端数值的影响,不能充分反映实际的差异程度。第23页,共30页,编辑于2022年,星期三成绩分析含义:是指所有观察值与算术平均数之差的绝对值的算术平均数。基本统计量及其含义平均差意义:平均差越大说明数据的差异程度越大。通用符号AD 第2
15、4页,共30页,编辑于2022年,星期三成绩分析含义:方差和标准差利用对离差进行平方的方式避免了离差之和等于零的情况。标准差是方差的平方根,也可以利用原始数据直接进行计算。基本统计量及其含义方差和标准差第25页,共30页,编辑于2022年,星期三成绩分析基本统计量及其含义标准分符号及公式含义:是一种由原始分推导出来的相对的位量数,它是用来说明原始分在所属的那些分数中的相对位置的。Z 分数准确地刻划了一个分数在一批分数中的相对位置,在Z分数的基础上进一步转换,发展出了一系列其他形式的标准分。如,T分数。例如:张月和李娜两同学的数理化三科成绩如下表:例如:张月和李娜两同学的数理化三科成绩如下表:如
16、果按照我们常用的实际分值,这两个人的总分相同,在年级排队的位置一样。但是,换算成了如果按照我们常用的实际分值,这两个人的总分相同,在年级排队的位置一样。但是,换算成了T T分数后,分数后,李娜的成绩显然优于张月的。原因是在原始分中,数学的李娜的成绩显然优于张月的。原因是在原始分中,数学的1 1分和物理、化学的分和物理、化学的1 1分的值是不等的,即含金量是不分的值是不等的,即含金量是不同的。这样的分相加后的可比性就比较差,常会出现很大的误差。从以上的同的。这样的分相加后的可比性就比较差,常会出现很大的误差。从以上的T T分数也可以看出各学科的贡献率。分数也可以看出各学科的贡献率。总分都是总分都
17、是229229,张月的数学贡献率较物理的大(数学在总体的位置靠前),李娜的数学和物理的贡献率一样大,张月的数学贡献率较物理的大(数学在总体的位置靠前),李娜的数学和物理的贡献率一样大(这两科在总体的位置一样)。(这两科在总体的位置一样)。635176.376.3平均分平均分189170.5229229总总分分4962.512717086化学化学70536748676物理物理70554657367数学数学李娜李娜张张月月李娜李娜张张月月T分数分数年年级标级标准准差差S年级平均分年级平均分姓名姓名考考试试科目科目第26页,共30页,编辑于2022年,星期三成绩分析的功能u(一)、教学信息的反馈功能
18、(一)、教学信息的反馈功能u 通过成绩的分析,可以调节整个教学活动。能使教师及时了解学生的学习情通过成绩的分析,可以调节整个教学活动。能使教师及时了解学生的学习情况,发现教学中的问题,为改进教学方法,修改教学计划,调整教学内容,制定况,发现教学中的问题,为改进教学方法,修改教学计划,调整教学内容,制定新的教育目标提供依据。新的教育目标提供依据。u(二)、教育效果的评价功能(二)、教育效果的评价功能u 通过成绩分析,可以鉴别学生学业成绩,评价教师教学效果以及评通过成绩分析,可以鉴别学生学业成绩,评价教师教学效果以及评估一所学校或一个地区教学质量的好坏。促进教育教学质量的提高。估一所学校或一个地区
19、教学质量的好坏。促进教育教学质量的提高。u(三)、教育理论的研究功能(三)、教育理论的研究功能u 通过对成绩的分析,能不断总结教育、教学经验,促进教育的不断通过对成绩的分析,能不断总结教育、教学经验,促进教育的不断深入和发展。好的教材教法,成功的教改试验,要通过教育教学效果来深入和发展。好的教材教法,成功的教改试验,要通过教育教学效果来体现,而教育教学效果在一定程度上又要通过成绩来检验。体现,而教育教学效果在一定程度上又要通过成绩来检验。第27页,共30页,编辑于2022年,星期三教育测验中值得注意的问题(一)、正确认识测验的作用(一)、正确认识测验的作用 测验其目的是为了改进教学方法,提高教
20、育教学质量。测验不应该是教学的指挥棒。测验其目的是为了改进教学方法,提高教育教学质量。测验不应该是教学的指挥棒。、我们不应该为了测验而教、我们不应该为了测验而教“测验测验”,学学“测验测验”。(二)、测验内容取样要有代表性(二)、测验内容取样要有代表性 在教育测验中,要用科学的方法编制题目。内容取样要具有代表性、典型性,重点难点掌在教育测验中,要用科学的方法编制题目。内容取样要具有代表性、典型性,重点难点掌握得当,题目数量要适中。对教材内容要仔细分析,反复推敲,使整个测验内容具有较高效握得当,题目数量要适中。对教材内容要仔细分析,反复推敲,使整个测验内容具有较高效果。果。(三)、按照教学大纲、
21、教学目标的要求编制测验(三)、按照教学大纲、教学目标的要求编制测验 在教学过程中测验的目的在某种程度上是为了检验教学目标是否实现,教学大纲的要求是否达在教学过程中测验的目的在某种程度上是为了检验教学目标是否实现,教学大纲的要求是否达到。因此,要是教育测验真正起到鉴别教学目标是否实现的作用,在编制测验时,要特别注重按教到。因此,要是教育测验真正起到鉴别教学目标是否实现的作用,在编制测验时,要特别注重按教学目标和教学大纲的要求来编制测验。特别在测验内容上要反映出这一要求。学目标和教学大纲的要求来编制测验。特别在测验内容上要反映出这一要求。第28页,共30页,编辑于2022年,星期三u(四)、采用合
22、适的测验题目形式(四)、采用合适的测验题目形式u 要采用合适的测验题目形式,必须根据教学内容的特点和教学目标的要求来确定。不同要采用合适的测验题目形式,必须根据教学内容的特点和教学目标的要求来确定。不同的形式具有不同的测验功能。一般说来,客观性试题适用于测验学生的知识、记忆、分析、的形式具有不同的测验功能。一般说来,客观性试题适用于测验学生的知识、记忆、分析、综合、判断、推理和一定程度的创造能力,测验覆盖面广,评分误差和猜题可能性都小。我综合、判断、推理和一定程度的创造能力,测验覆盖面广,评分误差和猜题可能性都小。我们提倡客观性试题中的多重选择题形式,因为这种形式功能多样,他的类型繁多,结构多
23、样,们提倡客观性试题中的多重选择题形式,因为这种形式功能多样,他的类型繁多,结构多样,难度范围广,是一种理想的测试题目类型。难度范围广,是一种理想的测试题目类型。u(五)、根据测验目的、性质和功能,适当编排性能优良的题目(五)、根据测验目的、性质和功能,适当编排性能优良的题目u 教育测验最好的题目,就是指测定所需要的特征,并能对该特征加以有效区分,教育测验最好的题目,就是指测定所需要的特征,并能对该特征加以有效区分,而且是难度合适的题目。一般说来,题目的区分度越高越好,这是选择题目的一条重而且是难度合适的题目。一般说来,题目的区分度越高越好,这是选择题目的一条重要标准。但对于难度来说,没有一个
24、绝对好的标准,要根据测验目的来确定。如果是要标准。但对于难度来说,没有一个绝对好的标准,要根据测验目的来确定。如果是选择少数拔尖人才,则难度大一些,若果是平常的单元测验,难度则不宜太大,有的选择少数拔尖人才,则难度大一些,若果是平常的单元测验,难度则不宜太大,有的测验可以不考虑难度。就是同一张试卷,题目难度也可以不同,只要整个测验的平均测验可以不考虑难度。就是同一张试卷,题目难度也可以不同,只要整个测验的平均难度符合测验要求即可。一般说来测验应当由易到难,以解除考生紧张情绪,建立考难度符合测验要求即可。一般说来测验应当由易到难,以解除考生紧张情绪,建立考试信心,进入测验情景。试信心,进入测验情景。第29页,共30页,编辑于2022年,星期三第30页,共30页,编辑于2022年,星期三