2022年评语大全之测量工作评语 .pdf-淘文阁

资源描述

《2022年评语大全之测量工作评语 .pdf》由会员分享，可在线阅读，更多相关《2022年评语大全之测量工作评语 .pdf（21页珍藏版）》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、测量工作评语【篇一：测量与评价问答题】测量的要素单位，参照值，量表。教育测量的含义它是根据测量学的原理和方法对教育现象及其属性进行数量化研究的过程。教育测量特点1 测量结果的间接性2 度量单位的相对性3 测量对象的复杂性 4 测量目的的针对性教育测量的功能：1、有利于提高教育、教学的水平2、有利于提高教育管理的水平3、有利于发展教育研究的方法。教育评价的含义是根据一定的教育价值或教育目标，运用可行的科学手段，通过系统的收集信息，分析解释，对教育现象进行价值判断，从而为不断优化教育和教育决策提供依据的过程。意义它是教育管理的重要组成部分，是深化教育改革的重要措施，是全面提高教育质量的重要手段。功

2、能导向，监督检查，激励，筛选择优，诊断改良。教育测评的历史测量萌芽时期1864 以前，蓬勃发展1864-1940 ，深入发展；评价开创时期1930-1958 ，大发展 1958-1972 ，专业时期。衡量测量质量的四个指标信度，效度，难度，区分度如何提高信效区分度；信度指的是测量结果的稳定性或可靠的程度，亦即测量的结果是否真实、客观地反映了考生的实际水平。类型稳定性系数，等值性，内部一致性，论文式测验的信度系数，平分者信度 1 适当增加测验题目的数量2 测验的难度要适中3 测验的内容应尽量同质 4 测验的程序应统一5 测验的时间要充分6 评分要尽量做到客观化，减少评分误差效度指一个测验能够正确

3、测量所要测量的属性或特征的程度。1 控制系统误差2 精心编制量表3 妥善组织测验 4 扩充样本容量和代表性5 合理处理效度和信度的关系6 适当增精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 1 页，共 21 页加测验的长度区分度指试题能否将考生区别开来的量度指数。1 使题目难度适中，是整个考试难度适中2 着重考啥复杂的学习结果难度1考查知识点的多少2 考查对题目的熟悉程度3 考查能力的复杂程度或层次的高低4 命题的技巧性 20 世纪 50 年代国外的教育目标的分类法布卢姆认知目标分类1 知识 2 理解 3 应用 4 分析 5 综合 6 评价加涅教

4、育目标分类智力技能，认知策略，言语信息，运动技能和态度。梶田叡一基础目标，提高目标，体验目标。确定目标应注意的问题1 深入分析课程教学目标2正确选择目标领域及其类目3 正确理解各类目标之间的关系教通用的题型是非题，配对题，选择题，填空题，改错题，名词解释题，简答题，计算题，论述题。怎样进行命题设计1内容类测验目标模型的构建， 2内容点测试目标表确实定3命题方案表的设计试题编制的质量要求1 明确测验目标2 题量尽可能大3 掌握好试题的区分度 4 注意改良题型5 每道试题的编写要讲究科学性6 制定好标准答案，评分标准和评卷的具体要求7 拼卷和检核试题编制的组织管理1 组织领导与命题人员2 命题过程

5、的组织管理测试实施要抓好如下工作1 指定专人做好考务工作2 确定测验形式和审查学生测验资格3 考场的组织 4 测验评卷与测验质量检查5 补考教育评价的基本原则1 方向性原则 2 公平性 3 客观性 4 科学性 5 可行性 6 指导性教育评价指标体系的结构1 框架 2 模型 3 指标 4 标准效能，素质，职责5 量化符号什么是评价指标体系的信度和效度？检验评价指标体系信度有那些方法？信度重评，评价者，事实信度。效度是指评价指标，评价标准，评价的量化符号等元素书记的准确性和代表性。如何构建教育评价指标体系？1 掌握构件建教育评价指标体系的依据2 掌握评价对象逐级分解的方法3 掌握评价等级和标准确定

6、的方法4 掌握指标和等级数值分配的方法有哪些评价标准的编制方法？ 1 期望评语式编写法2 积分评语式编写法3 隶属度式编写法 4 行为目标式编写法5 量表式 6 量尺式教育评价方案的编写包精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 2 页，共 21 页括哪些部分？是以教育评价指标体系的撰写为核心的，包括前言，评价指标体系，和附录部分的编写。简述教育评价实施的基本步骤1准备工作思想准备，材料和工具的准备，组织准备2 评价的实施自评，他评 3 评价结果的处理评价结果的分析判断，作出综合评价的结论，评价结果的信息反馈，评价工作的总结五类教育评价方法1

7、绝对评价法相对与个体内差异评价法2 定性分析评价与定性综合判断法3 行为目标评价法和临床督导评价法4 指标评分法和等级还分法5 加权平均法，模糊综合评判法，集体综合评价法和坐标综合图示法教育评价信息的收集标准1 准确性 2 可靠性 3 时限性评价信息的收集方法1 观察法 2 听汇法 3 调查访问 4 座谈会 5 收集文字资料6 发问卷 7 测试教育评价定性分析描述方法等级评定法，评语鉴定法和写实分析法定量分析评判分为统计分析评判法 1 平均数 2 加权平均数 3 标准差 4 标准分数 5t 分数模糊综合评价法 1 确定判断的因素集u2 确定因素权数2 确定评价等级4 建立因素集的模糊矩阵

8、5 选择评判模型6 计算综合评价值教育评价结果的合成方法 1 单纯普通数据的合成方法2 单纯模糊数据的合成方法3呼和数据的合成方法教育测量的数据有何特点一是数据的波动性二是数据的规律性教育测量的数据有哪些种类按数据来源分1 点击数据 2 度量数据按照数据的连续分 1 间断性数据2 连续性数据按数据的精确程度分1 类别变量 2 等级变量 3 等距变量 4 比率变量统计表的结构有哪些表序，表题，标目，线条，数字，表注如何编制频数分布表1 求全距 2 定组数 3 求组据 4 定组限 5 求组中值 6 归类划记简述标准分数的意义和公式百分数等级分数及计算教育测量分数的组合有哪些常用方法1 直觉判断

9、 2 加权求和 3 多重选择 4 多重回归多科测验分数加权平均标准化的意义和方法教育评价心理的分类一根据心理学范畴可分为评价的心理过程，心理状态，心理特征二根据评价过程的阶段可分为组织过程心理，设精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 3 页，共 21 页计过程心理，实施过程心理，评价过程心理和被评价者准备心理，自评心理，受评过程心理，结果反馈心理三根据评价者或者被评价者的心理机制分为意识倾向，情意心理，认知倾向，个性心理特征评价者对被评价者的一般心理影响有哪些1 对自信心和自我概念，自我知觉得影响2 对情绪稳定和不安的影响3 对意志和动

10、机的影响4对要求水平和到达目标的影响5 对评价者和被评价者之间关系的影响评价者心理对评价过程有何影响1 对制定评价方案的影响2 对收集和分析评价信息的影响3 对测定与评价的影响4 对评价结果解释的影响调控评价心理有何意义1 通过心理调控，可以使教育评价的准备更加合理充分2 通过心理调控，可以保证教育评价活动的事实得以顺利进行，更好的完成各个环节的任务3 通过心理调控，可以使评价的功能得以全面发挥，圆满实现评价的目的评价者在准备过程中有何心理现象1 角色心理 2 心理定势 3 新奇感 4 时尚效应 5 期望效应评价者在评价过程中有何心理现象1 自尊心理 2 首因效应 3近因效应 4 晕轮效应

11、5 参照效应 6 理想效应 7 顺序效应 8 趋中心理9 成见效应 10 宽大效应 11 附和权威心理评价者在结果处理过程中有何心理现象1 类群心理 2 从众心理 3 逆反心理 4 本位心理 5 模式效应被评价者在受评过程中有何心理现象1 应付心理 2 迎合心理 3 自卫心理被评价者在结果反馈中有何心理现象1敏感心理 2 护短心理 3 嫉妒心理 4 对评价进行评价心理科举考试的内容贴经，墨义，策问，论，诗赋现代与古代语文考试的不同点 1品德测评的意义有利于学生思想上的自我教育和学校德育工作的顺利开展， 2 有利于激励先进和鞭策后进3 有利于学生德育管理4 品德测评时德育和行为科学研究的重要手

12、段品德测评的类型1 诊断性测评 2 形成性测评 3 总结性测评品德测评的要求1 外显行为测评与道德认识测评相结合2 单项测评与整体测评相结合3 定性测评与定量测评相结合品德测评指标体系的依据1 依据社会的需要2 依据德育大纲 3 依据品德结构4 依据学生年龄特征构建中小学生品德测评指精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 4 页，共 21 页标体系的基本要求1 重视指标体系的开放性2 重视指标体系的教育性 3 处理好普遍性和特殊性的关系4 处理好稳定性和发展性的关系5处理好统一性和灵活性的关系品德测评的方法1 定时考核法2 问卷测评法 3

13、项目评分法 4 情境测验法 5 社会关系测量法6 意向测评法 7 行为观测法教师评价的含义是对教师活动进行描述和价值判断的过程。对象是教师活动中抽象存在物和非抽象存在物特点 1 教师被评价者评价是一个活动过程它是一种特殊的连续活动，包括一系列的步骤和方法。2 教师评价是有目的有计划的活动过程3 教师评价的根本目标在与形成价值判断，进而做出选择4 教师评价活动中评价者和被评价者事统一的教师评价的主体1 教育行政部门，学校，教师参评2 学生参评 3 家长参评 4 教师自评教师评价的模式有1 实证范式评价行为目标评价模式，操作主义评价模式2 人为范式评价发展性评价模式，主体性评价模式，团体性评价模式

14、，教师校本评价教师评价的程序 1 确定评价目的2 确定评价者 3 制定评价指标体系4 确定评价方式 5 评价过程的实施教师评价指标体系应由三个维度素质评价指标 1 思想道德素质2 文化理论 3 身体心理职责评价指标1 育人管理职责 2 教学科研 3 协同工作绩效评价指标育人管理成效2教学科研成效3 协同工作其中素质评价指标是教师实施教育教学的基础，职责评价指标是教师实施教育教学的关键，绩效评价指标是教师实施教育教学的最终目标。什么是教学工作评价？它有哪些主要功能？是对教学工作的过程和结果进行的价值判断。功能1 检查 2 反馈 3 激励 4 研究 5 定向 6 管理教学工作评价应注意什么问题？1

15、关于教学工作量与质的关系问题2 关于他评价和自评价的关系问题教学工作评价的宏观依据是什么？1 依据教育方针和政策法规2 依据教学大纲和教科书3 依据教学规律与教学原则 4 依据学生身心发展规律5 参考新的思想观念教学工作评价的内容是什么？包括对教师备课上课批改作业课外辅导命题考试等教学工作基本环节的评价内容。还有两问精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 5 页，共 21 页什么是课程评价？泰勒目标达成模式的概括内容是什么？对泰勒目标达成模式做简要评价。简述课程评价模式的发展与课程，评价认识发展的关系？我国学校体育评价应该遵循什么原则？1

16、自主性原则 2 动态性原则3人文化原则 4 多极化原则你如何看待江苏省江阴一中进行体育评价改革？如何评价体育老师的教学质量？学生在课堂上的行为表现，情绪体验，知识获得以及交流合作等方面，包括学生参与教育的时机，时间长短，积极性和效果，以及学生对课堂的情绪体验，对教师行为的反应，学生在教学结束时知识掌握的情况，学生在课堂终具体的合作，探究行为等等，成为判断一堂课成功的主要依据。学校评价的目的及意义是什么？目的1 改良学校管理，充分发挥学校效能 2 判断学校工作的好坏，评定学校的优劣。意义1 中小学学校评价是现代学校教育发展的客观要求，也是我国基础教育改革的迫切需要2 学校评价对学校教育起着重要

17、的定向引导作用3 学校评价可以促进学校领导和教职职工的发展 4 学校评价有利于调动社会各方面的力量关心学校教育现代中小学学校评价的内容有哪些变化？1 学校的发展目标2 学校的发展能力 3 学校发展的自我保障机制4 学校的发展成效学校管理评价的涵义是什么？它包括哪些内容？含义指根据一定的教育目标，通过决策，计划，组织，指导和控制，有效地利用教育的各种要素，以实现培育人的学校管理活动。发展性学校评价的基本理念是什么？这些理念是如何指导学校评价的？理念1 变一元标准为多元标准2重视学校发展过程3 发展学校自主评价你认为在建筑发展性学校评价的模式时要注意的问题有哪些？1 在学校自评与他评的关系上，要以

18、学校自评为主，外部他评为辅2 在形成性评价和终结性评价的结合上，要以注重过程的形成性评价为主3 在发展过程和发展结果的关系上，要侧重于发展过程4 在统一标准和办学特色的关系上，要强调办学特色5 要重视评价结果的反馈精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 6 页，共 21 页二、什么是形成性测量与评价、诊断性测量与评价和总结性测量与评价？它们的使用有何重要意义？答：形成性评价是指在教育、教学活动计划实施的过程中，对计划、方案执行的情况进行的评价。其目的是为了了解动态过程的效果，及时反馈信息，及时调节，使计划、方案不断完善，以便顺利到达预期的目

19、的。诊断性评价是指在教育、教学活动开始之前，为使计划更有效地实施而进行的预测性、摸底性评价。其目的是为了摸清评价对象的基础和情况，分析存在的问题，为解决问题搜集必要的资料，以找到解决问题的方法。总结性评价是指某一教育、教学活动项目告一段落或完成以后进行的评价。其目的是为了了解这项活动到达预期目标的情况以及它的最终效果或效益。六、如何理解教育目标与测验目标的关系？答：测验目标是测验编制者所编制的测验所要到达的某种具体的目的，它明确规定测验所要到达的预期结果或标准。测验目标确实定是以教育目标分类理论为基础的。布式的认知目标分类法一直被认为是测验目标分类的依据。七、试述设计测验蓝图的主要步骤。答：

20、1内容类测验目标模型的构建，2内容点测试目标表确实定， 3命题方案表的设计。八、试述布卢姆关于认知领域的教育目标分类的内容。答：布卢姆把教育目标分为认知领域、情感领域和动作技能领域，把认知领域分为知识、理解、应用、分析、综合和评价等六类。精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 7 页，共 21 页九、测验试题主要有哪些类型？试分析各类试题的测量功能与命题要求。答：题型可分为两大类，一类是封闭式，另一类是开放式。封闭式题型的答案是固定的，十分正确，评分客观、可靠。包括选择型和提供型，选择型包括是非题、配对题、选择题等，提供型包括填空题、改错题

21、、名词解释题、简答题。开放式题型正确答案的自由度比较大，由评分者掌握，不能用机器阅卷。包括计算题、证明题、论述题、写作题、设计题、翻译题等。是非题由一个陈述句构成，要求学生判断真或假，是或非，对或错，等等。主要功能是测量学生判断陈述句子的正确性能力。配对题是一种改造的选择题。它把一系列的题干列成一列，把配备的选项列在另一列，即数个题干共同使用相同的几个选项，要求所有选项均构成每一题干的似真项。主要功能是测量学生对字词的、事件、人物、地点、公式、原理等关系的识记能力和联结能力。选择题是由一个题干和几个选项所组成的试题，其功能是迷惑那些无法确定正确答案的考生，测量学生对问题的理解、再认、比较与区分

22、的能力，以及思维的敏捷性和准确的判断力。填空题是提供一个留有空隙的不完整的陈述句子，要求考生将空缺的字、词、句填补下去。主要功能是测量学生的记忆能力。改错题是提供有错误的陈述句子，要求考生在句子错误部分的下面画线，并将正确答案写在线下面。功能是测量学生的判断能力、记忆能力和理解能力。名词解释题是提供重要的名词或概念，要求考生作出正确的解释。功能是测量学生对一些重要术语、概念的掌握情况。简答题是提供问题要求考生对考题作出简要答复，它常常由一个直接问句或不完全表达句构成。功能是测量考生对重要知识的记忆程度。精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第

23、 8 页，共 21 页计算题是在试题中提供计算条件，提出计算要求，要求考生计算结果，有时还要求作出解答。功能是测量考生解决问题思维能力以及运算技巧的掌握程度。论述题是向考生提出较为复杂的问题，要求作出分析、说明、解释、论证，或作出结论，或提出自己的观点和见解。功能是测量考生组织知识、表达思维和分析问题、解决问题的能力。十一、多元智力理论的基本观点。答：美国哈佛大学心理学教授贾德纳的多元智力理论强调人类智慧至少应包括以下7 种不同的智力 1言语智力； 2数理逻辑智力； 3空间智力； 4音乐智力； 5体能智力；6人际智力； 7自知智力。贾德纳认为，传统的智力测验只是测试了言语智力和数理逻辑智力，无

24、视了其他的智力。在贾德纳的观念中，上述7 种智力在人们的实际生活中是同等重要的，并无主次之分。他还指出，由于时代的不同和文化上的差异，这7 种智力在人们心目中的重要性是常有转移的。十三、教育信息的特点和收集方法。答：特点： 1准确性 2可靠性 3时限性。方法：1观察法 2听汇报 3调查访问 4座谈会 5收集文字资料6发问卷 7测试【篇二：测量正确度评价】测量正确度评价南通大学附属医院王惠民精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 9 页，共 21 页测量正确度 measurement trueness简称正确度，指无穷多次重复测量所得值的平均

25、值与一个参考值间的一致程度1 。正确度不是一个量，是个抽象概念，不能用数值表示，因为在实际工作中对同一被测对象不可能进行无穷次测量。正确度与系统误差有关，与随机误差无关。只可说正确度“ 好” 或“ 差” ，正确度的好差可用偏移来衡量，而偏移可用数量表示。“ 测量正确度 ” 不等同于 “ 测量准确度 ” 。测量偏移 measurement bias简称偏移，有的文献称为偏倚，指系统测量误差的估计值。常通过将测量结果的平均值减去参考值如有证参考物质的值获得，偏移可为正数或负数。可计算绝对偏移，也可计算相对偏移。正确度是方法学评价的重要内容。一、正确度评价的内容正确度评价实际上就是进行实验设计并计算

26、偏移的过程。可通过与一个参考值比较计算偏移，该参考值可来自于参考物质、室间质量评价 eqa/pt 的靶值、方法学比较试验、回收试验等。正规的方法比较实验是将常规测量程序与参考测量程序rmp 比较。建立 rmp 对于临床实验室来说，是一件十分困难的事，因此大多数情况下不能直接与rmp 比较，而只能与较好的方法或原有的方法进行比较。 clsi ep9-a2 用患者标本进行方法比较试验及偏移评估2 和ep15-a2 精密度和正确度性能的用户验证3 都介绍了用方法比较试验进行正确度评价，其主要差异是，前者要求的实验次数较多，每天测 8 个标本， 5 天完成，共测定40 份标本；后者测定20 份标本，可

27、在 1 天内完成。前者对数据进行严格的统计处理，而后者的计算较为简便。因此，ep9-a2 更适用于方法学的正确度确认，而ep15-a2 仅适用于方法学验证。clsi ep10-a3临床实验室定量检测方法的初步评价 4 是同时评价精密度、正确度、线性、携带污染率的方法，是一种更简易评价正确度的方法。精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 10 页，共 21 页二、正确度的判断正确度的性能是通过偏移来进行判断的，对正确度性能进行评价也是通过实验确定偏移的大小，再根据相关原则进行判断。测量程序的正确度是否可接受主要依据以下几种方法进 1行判断：

28、与实验室自定标准比较；利用效能函数判断；与国家标准比较；与 clia 88 推荐的允许总误差比较；与厂家声明的偏移比较；通过方法性能决定图判断。以往有作者在进行方法学比较时，用统计学处理方法如配对t 检验、相关系数 r分析，但统计学差异显著的，并不表示该试验方法在临床上不被接受，反之亦然。t 检验和相关系数不能用来进行正确度的判断。 1. 与实验室自定标准比较 2. 利用效能函数判断 en= x1-x2+u 2 1 22 3. 与国家卫生标准的要求比较卫生部于 2012 年中华人民共和国卫生行业标准ws/t 403-2012临床生物化学检验常规项目分析质量指标7 ，规定了允许偏移的标准。表

29、 1 国家卫生标准允许偏移%2精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 11 页，共 21 页 4. 与 clia 88的要求比较与 clia 88的允许总误差 tea要求比较，一般偏移1/2 tea 时，被认为属于可接受水平。 5. 与厂家声明的偏移比较如实验室得到的偏移小于厂家声明的，说明该方法可在临床应用；如大于厂家声明的，则需进行统计学处理后再进行比较，如ep15-a2评价方案。 6. 通过方法性能决定图判断1方法性能决定图的意义精密度和正确度是方法性能中最重要的指标。应用westgard方法决定图，根据试验方法的偏移和不精密度找出其

30、在方法决定图上的位置，用以判别方法性能。方法决定图是以tea为判断标准的一种方法，一般有四种判断标准：偏移+2s ，即bias+2stea ；偏移 +3s ，即+3stea ；偏移+4s ，即+4stea ；偏移+6s ，即 +6stea 。2方法性能决定图的使用假设试验方法性能位于+2s 线以外，属不可接受性能，该方法不能在临床应用；方法性能点在 +2s 和+3s 区域内被认为方法性能差；方法性能点处于，方法性能属临界，该方法在实+3s 和+4s 线的区域包括在 +4s 线上的际使用中需要进行严格的质量控制；方法性能点越接近左下方，其方法性能越好，假设方法性能点处于+6s 以内，其方法性能

31、已到达世界顶级水平 world class performance，这样的方法很容易管理和控制。 3图 1 方法性能决定图3应用例如精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 12 页，共 21 页某测定白蛋白的方法，测定值35 g/l 处的 cv 为 1.8% ，偏移为 0.2% ；clia88的质量要求是10%；x 取 1.8%，y 为 0.2% ，即图中的 “1”点，如图 2 所示。因此它在方法性能决定图上的性能点位置清楚说明方法的性能属于优秀。图 2 方法性能决定图应用例如三、与参考物质比较计算偏移 1. 常规方法将有证参考物质连续测量

32、35 天，每天测量35 次，直接计算偏移的绝对值或相对偏移。用常规方法对标准物质连续进行5 天测定，每天测定5 次，获得如表 2 结果。表 2 常规方法测定肌酐标准物质结果mmol/l 测定序次第 1 天第 2 天第 3 天第 4 天第 5 天 1 2 3 4 5 140 140 140 141 140 138 139 138 137 139 143 144 144 145 143 143 143 142 143 142 142 143 141 142 143 4mmol/l 2. clsi ep15-a2方法连续测量5 天，每天测量2 次，每天尽量由不同的操作者进行操作。根据可信限，

33、计算出偏移的允许区间。精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 13 页，共 21 页例 2：40mg/dl 的血糖参考物质，试剂的来源及批号为mk243 ，校准品为 rnc59lw 。测量结果及计算见表3。表 3 血糖参考物质的测量结果及计算1计算均值 x=x i n i n = (x1+x2+x3+x4+x5+x6+x7+x8+x9+x10) 10 = 3772计算标准误 5【篇三：测量、测试与评价】我们在工作中经常用到“ 测试” 、“ 测量 ” 、“ 考试 ” 、“ 测验” 、“ 评价 ”等术语或说法。它们之间既有联系，又有区别，不能混

34、为一谈。 1测量精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 14 页，共 21 页什么是测量？ stevens 195认为， “ 广义而言，测量measurement就是根据法则赋予事物数量。” 也就是说，按照一定的规则给事物的属性指派数字或符号的过程就是测量。这是迄今为止公认的测量定义。举例来讲，要测量一下桌子的高度，我们可以拿尺子来量一量，看看它有多高。尺子是人们根据一定的法则制定的量具，利用它就可以把事物的属性，即桌子的高度用数字表示出来，如，0.75 米。这种测量属于客观测量，因为它基本上不受观察者的主观判断的影响。由此可以看出，测量这

35、一定义包含三个要素：事物及其属性这是测量的对象或目标。上面提到的对桌子的高度进行测量，属于对物体进行测量，其属性高度，是可以观察到的，可以进行客观测量的。在外语教学领域，我们感兴趣的是学生的语言能力，而学生的语言能力属于人的心理特征，是无法直接测量的，但是人的心理活动会在人的具体活动和行为中表达出来，所以只能通过测量其外显行为或外在表现特征来推论一个学生语言能力的高低。指派数字或符号所谓指派数字或符号，就是用数字或符号来代表某一事物或事物的某一属性的量。如张三在本次阅读考试中得了87 分，李四得了92分，我们说李四比张三多考了5 分。数字本身没有意义，只是一种符号。我们用它来代表考生的阅读成

36、绩，这时它就变成了量化的数，可以对其进行解释和分析。在一定的条件下，还可以对数据进行运算从而对事物的属性进行推测。法则法则是指测量所依据的规则和方法，是测量的关键。法则不好或不可靠，得到的测量结果就会出偏差，失去测量的意义。简单来说，尺子不准，测量的结果就无法使人信服。对客观世界的物体进行测精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 15 页，共 21 页量时，由于有公认的测量法则或尺度，如测量物体的高度、重量等；一般不会出现大的偏差。而对人的某些特性心理特征进行测量时，则往往会出现较大的偏差。举例来讲，有几个评委对某学生的英语口语进行评定。评

37、委a 认为一个人的口语要好，必须发音准确，而该学生的发音好，所以他给打了个5 分。评委 b 认为流利性最能表达一个人的口语水平，该同学尽管发音不错，但流利性差一些，所以她给他 3 分。同一名学生，让不同的评委去打分，成绩出现了偏差。这也很自然，原因是他们没有按照一个评定口语成绩的统一法则rules 去给这名学生打分，结果造成了偏差。这个例子提醒我们，在对人的某些心理特征，如口语表达能力、阅读理解能力等等进行测量时，首先要制定一个便于操作的，稳定的法则或标准。这样得到的测量结果才可靠，才具有可比性。 2测试测试 test 又称测验。不同的心理学家对此下的定义不同。anastasi 1982认为，

38、 “ 测试实质上是对行为样本所做的客观的标准化的测量。 ” 这个定义是人们公认的最权威的定义，它包含以下三个基本要素：行为样本语言测试的目的是要测量受试者的语言能力。上面提到，语言能力是无形的，如何主测量？只能测量它的有形表现，这里所说的有形表现，是指语言表现，如说出来的话，写出来的句子，对测试题目所做的各种反应等等、这些行为，都是无形的语言能力的有形表现，用心理学术语叫 “ 表征” manifestation。所谓行为样本，是指对语言能力表现行为的有效的抽样。我们知道，一个人的语言能力的表现行为会有各种各样的形式，测试时不可能也没有必要把它的全部表现行为都测到，只能选取一部分有代表性的抽样进

39、行测量，然后据此对受试者的语言能力作出推测。精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 16 页，共 21 页客观的测量所谓客观的测量是指测量的标准是否符合实际。对于一项测试的客观性程度可以从这么几个方面去评价：测试题目的难易度和区分度如何；测试结果的可靠性程度如何？测试结果的有效性如何？这几项指标是衡量一项测试质量的重要指标。标准化的测量标准化的测量是指在测试题目的编制、测试的实施、记分以及对分数的解释等方面有一套严密的系统的程序。只有这样，测试才有统一的标准，对不同人的测量结果才有可比性。但凡不标准化的测量，都没有可比性。 3评价 wei

40、ss 1972 认为， “ 评价 evaluation是指为作出某种决策而收集资料，并对资料进行分析，作出解释的系统过程。” 与测量、测试相比，评价的含义更广、综合性更强。bachman 1990指出，决策的正确与否，一方面取决与决策者本身的能力，另一方面则取决于收集到的信息的质量。在其它条件等同的情况下，如果收集到的信息越可靠，相关性越强，那么，作出正确决策的可能性就越大。所以说，评价的一个很重要的方面就是要获得可靠的、相关的信息。在谈到评价与测量及测试的关系时，bachman指出，在对个体学生作出评价时，我们可以从质量和数量两个方面进行描述，或只描述其中一个方面。所谓质量方面的描述是指对学

41、生的行为作出定性的描述，如某某学生的口头表达能力优秀，书面表达能力优良等；数量方面的描述则是指某次测验的分数等。对于测试、测量及评价三者之间的关系，他用下面的图来表示。测试、测量及评价三者之间的关系一、对现行测评方法的评价精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 17 页，共 21 页一问题的提出随着国家人事制度改革的不断深入，人才测评已经有了一个可喜的开端，尽管尚有不尽人意之处。然而“ 如何测好 ” 的问题又刻不容缓地摆在我们面前。应该说，十年间，我们在探索科学、“ 如何评价 ”人才选拔方面，已经取得了一定的进步。例如，在人才选拔过程中，

42、重视思想政治素质，强调人才的实际能力，以及开始了向社会公开招考、择优录用的大胆尝试。但是仍然存在一些薄弱环节。例如，虽然建立了考试机制，但缺少统一的标准；在考试的内容上，多偏重于知识考查，无视发展潜能的预测；在考试技术上，沿用教育测量的作法多，借助于多种科学，引用新技术的尝试少。尽管考试录用人才的作法已赢得社会和用人部门的认可，但是高分低能的问题仍未能得到解决。总之我们的任务十分艰巨，要使人才测评工作再上一个台阶，我们有必要对考试方法进行新的探索和研究。二考试内容的分析既然我们选拔录用人才是以“ 因事择人，专用一致” 为原则，那么岗位需要就是我们考试内容设计的依据。下面从影响工作成绩的因素出

43、发，对人才录用中应该考查的内容做如下分析。 1、智能因素：主要包括知识、智力、能力倾向、实践经验。知识与工作成效知识是个人经过有目的、有选择地学习后，在头脑形成的有系统、有层次的结构体系。知识与工作绩效的关系密切，它是做好工作的基本条件；正因为如此，目前我们的人才录用考试在知识的考查上比重都精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 18 页，共 21 页较大。对知识的考查，一是看容量，二是结构的合理性。后者对工作绩效的影响更为直接。这两年来，对学识的考查有过争论，有人主张学识并不是推测潜能的指标，而智力与能力倾向测验对潜能的预测才更有意义。

44、这种观点认为，管理人员的发展，主要决定在基本才能的具备和运用，而非决定于某专业方面的知识有多少。智力与工作绩效所谓能力是指人的认识能力和行为所到达的水平。亦可称为一般能力。智力与知识互为联系，但不是一回事，一个人的智力水平高，将有助于他尽快地接受和掌握知识；反过来知识的不断积累，又有利于 +智力水平的提高。但是智力的提高与知识的积累并不成比例。关于智力与工作绩效的关系，目前尚有争议。但大多数人认为智力因素是选择人员的必要条件。不过也有研究说明，当智力均已到达中等水平以后，它与工作绩效的相关甚微，尤其是在执行类人员中，高智力很可能导致低绩效。即使是在指导类管理者中，智力也并非越高越好，因为过于

45、聪明的人制定政策，往往容易脱离实际。所以有些国家在制定选人原则上，对常识、智力采取封闭式标准。即规定录用的最低限和最高限。能力倾向与工作绩效能力倾向的含义，尚有广义与狭义之分。广义地说，它包括人的身体条件、智能、性格、兴趣等是否精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 19 页，共 21 页适合于某个方面的职业领域。狭义地说，是指为了有效地进行某种特定活动所必需的特殊能力。值得指出的是，人的能力倾向是尚未接受教育训练的潜能，它同经过学习训练而获得的才能是有区别的。其次，能力倾向与智力之间无必然的相关。心理学的实践证明，人的特殊能力与智力的关

46、系很小。一个人具有较强的智力水平，可能会有一些特殊的才能，但也可能缺乏某些如音乐的美术的特殊能力。而那些有美术、音乐才能的人，其聪明性，既可能在平均者之上，也可能在平均者之下。所以我们不能从一个人的能力倾向来推测他的智力，同样也不能从他智力水平来推测他的特殊能力。能力倾向与工作绩效的相关是比较明显的，如果一个人的能力与他所从事的工作特点相匹配，那么就容易得到成功。我们提倡“ 用人所长 ” 就是这个道理。在二次世界大战以后，心理学的主要奉献就是在能力倾向测验的发展上，现在有很多研究迹象说明，智力测验越是趋于一般化，其价值越低。能力测验如果能突出特殊性就等于提高其价值。在我们现行的考试内容设计中，

47、大家似乎已经注意到这个因素的重要性，但在考查手段上还是一个薄弱环节。实践经验与工作绩效实践经验是指从亲身参加活动或者直接观察活动中得到的知识、技巧和行为方式。实践经验与工作绩效之间的相关性是显而易见的。尤其对于政府机关执行类的人才来讲，在某种意义上，经验比学历、知识更重要。当然三者又不可截然分开。精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 20 页，共 21 页值得指出的是，一个人被录用前的实践经验应当与他将要从事的工作性质是正相关时，他的实践经验才能继续获得用武之地，否则将没有考察意义。 2、非智能因素：主要包括政治素质、成就动机、社会适应

48、性、身体条件。政治素质与工作绩效政治素质主要是指一个人的政治立场、信仰和态度倾向，主要表达在思想觉悟、道德情操和价值水准上。政治素质将决定工作绩效的方向，是人才考核中不可无视的主要指标。成就动机与工作绩效成就是指一个人在工作中达成组织或个人目标所设置的期望值。实践证明，工作绩效的大小，取决于一个人的能力与成就动机的强度。即强度较高的成就动机将有助于工作上的成功。但是成就动机也并非越高越好。有研究说明，成就动机处于中等强度时，工作绩效最正确。近年来，英、美国家又发展了一种新的笔试，要求个人撰写本人的未来 “ 自传 ” ，设想个人今后五至十年的工作计划，以此测验应试者的成就动机和筹策能力，从而发现最合适的管理人才。社会适应性与工作绩效社会适应性是指人与社会相互作用时的心理承受水平以及自我调节能力。它包括人的气质、性格、应激能力等心理指标。精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 21 页，共 21 页

展开阅读全文