《2022年福建师大教育测量与评价期末考试要点整理 .pdf》由会员分享,可在线阅读,更多相关《2022年福建师大教育测量与评价期末考试要点整理 .pdf(3页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、1 一、策略:1、提倡“SSCIT”:社会(social)、科学(science)、文化(culture)、理念(idea)、技术(technology)2、课程功能:知识与技能、过程与方法、情感态度与价值观3、教学观与学习观:情感态度价值-能力-知识与学科技能二、论文:关于高考的对决:孙绍振、黄光扬,记者访谈三、具体内容:第一章 概念名人名言:1.“教师应该成为人类优秀文化的拥有者”2.“教师应该拥有教育测量与评价的理念与能力”3.“评价最重要的意图不是为了证明,而是为了改进”格兰朗德:评价=测量(定量描述)+非测量(定性描述)+价值判断斯塔费尔比姆:评价是一种划定、获取和提供叙述性和判断性
2、信息的过程。布卢姆:教育评价本质上“据我看来,评价乃是系统收集证据用以确定学习者实际上是否发生某些变化,确定学生个体变化的数量或程度。”教育目标:分为认知(知识、领会、应用、分析、综合、评价六个能力层次或学习水平)、情感与动作技能。“评价是为了某个目的而进行的活动,对各种东西的价值作出判断的活动。评价涉及应用准则和规格来估量各种具体事物的准确性、有效性、经济性和令人满意的程度。判断可以是定性也可以是定量的,准则的由谁规定也是自由的”测量(measurement):根据某些法则和程序,用数字对事物在量上的规定性予以确定和描述的过程。教育测量:针对学校教育影响下学生各方面的发展,侧重从量的规定性上
3、予以确定和描述的过程。教育评价:按照一定的价值标准和教育目标,利用测量和非测量的种种方法系统地收集资料信息,对学生的发展变化及其影响学生发展变化的各种要素进行价值分析和价值判断,并为教育决策提供依据的过程。两汉察举制。察举:察其贤能,举以授官。对策:根据主考官提出的一个问题,用笔试加以作答。射策:事先出好多道题目,由学生随即抽取一道加以作答。魏晋南北朝。九品中正制:以中正(各州设大中正,郡设小中正)为中心,论品定级,选拔和升降官吏。后背世家豪族所占有,逐步沦为“门阀制度”。隋朝。策试:以策问试士,是对臣下或举子的考试。行卷:考生将自己平时所作的优秀作文,主动地献给有关当权者或知名人士甚至主考官
4、,求得权威人士的青睐和帮助,以利录取。唐代:考试科目分为常科(主要科目明经、进士)和制科(皇帝临时下诏举行的考试)。国子监、太学及各地学校的学生叫生徒;不在学校读书的人叫乡贡。由乡贡入京应试者通称举人。州县考试称为解试,尚书省的考试通称省试,或礼部试。礼部试都在春季举行,故又称春闱,闱即考场。省试考中叫进士,进士再经吏部考试(选试),合格后,奏请课授予官职。明代。童生-院试-生员(秀才)-乡试-举人-会试-贡生-殿试-进士(金榜题名时)一甲(鼎元)状元,榜眼,探花。直接授予官职。(传胪)二名师资料总结-精品资料欢迎下载-名师精心整理-第 1 页,共 3 页 -2 甲(进士出身)、三甲(同进士出
5、身);都要参加翰林院考试,学习三年,再授官职。第二章类型:一、运用 时机分类:形成性测量与评价(单元测验)、诊断性测量与评价(对个人的问题行为及其原因进行诊断)、终结性测量与评价(期末考试)二、参照点 分类:常模参照测量与评价(与团体常模进行比较)、标准参照测量与评价(与既定的教育目标或行为标准相比较)、潜力参照测量与评价(实际水平与其自身潜在的水平相比较)。三、内容分类:智力测量与评价、能力测量与评价、成就测量与评价、人格测量与评价。标准化测验:有测量专家严格按照测验程序而编制程序而编成的一种测验。四大功能:1.实现教育判断功能。2.改进教师教学功能。3.促进学生学习功能。4.行驶教育管理的
6、功能。新概念:1.自适应测验:计算机自适应测验(Computerized Adaptive Testing,简称 CAT):以项目反应理论为基础,以计算机技术为手段,在题库建设、选题策略等方面形成了一套理论和方法。2.IRT(item response theory)项目反应理论:一系列心理统计学用来分析考试成绩或问卷调查数据的数学模型。-CTT(classical test theory)经典测验理论:最早实现数学形式的测验理论。3.3Q:IQ(智商)EQ(情商)PQ(体商)4.学习“医院”:通过测验性的学习去治疗个体身上各种非生理性的弊病。(我猜的)5.因材施测-因材施教:对个体针对性的测
7、试,不一笼统的考试。6.认知诊断测验(CDA cognitive diagnosis assessent):对个体知识结构、加工技能或认知过程的诊断评估。任务在于挖掘更多的认知加工信息。第三章1.信度:测量结果的可信程度。X(观察分数)=T(真分数)+E(测量误差)类型:重测信度(test-retest reliability):同一个量表对同一组被试施测两次所得结果的一致性程度。复本信度:(alternate-forms reliability)两个平行测验测量同一批被试者所得结果的一致性程度。分半信度:(split-half reliability)将一个测验分成对等的两半后,所有被试在这
8、两半上所得分数的一致性程度。克龙巴赫系数=K/(K-1)1-Si2/Sx2 K 为题目数、Si2第 i 题上得分名师资料总结-精品资料欢迎下载-名师精心整理-第 2 页,共 3 页 -3 的方差、Sx2所有被试各自总分的方差。相关系数:rxy=xy/(x2*y2)x=x-x,y=y-y yt=Zyhh/(1+rhh)(S-B 公式)2.效度:一次测量的有效程度。X(观察分数)=V(目标真分数)+I(非目标真分数)+E(测量误差)类型:内容效度概念:测验题目样本对于应侧内容及行为领域的代表性程度。分析方法:逻辑分析的方法、内容效度的量化分析方法。结构效度概念:理论与实际测验结果的一致性程度。分析
9、方法:测验内部寻找证据法、测验之间寻找证据法、考察测验的实证效度法。效标关联效度概念:一个测验对于处于特定情境中的个体行为进行预测时的有效性。分析方法:相关法、显著差异法、命中率3.难度:被试完成项目任务或题目时所遇到的困难程度。计算题:以全体被试得分率为难度系数:P=X/XmaxP:题目难度X:被试在某题目上的平均得分,Xmax该题目的满分。P 越大,题目越简单。4.区分度:题目区分被试水平能力的量度。计算题:高分分组法:从总数中取出两组分别为高分组(占总数的前27%)和低分组(占总数的后 27%)。D=PH-PLD 代表项目鉴别度指数、PH、PL高低分组在该题目上的得分率。D 的值:0.4 以上优良0.30.39 合格0.20.29 尚可,需修改0.19一下应淘汰一杯坠 整理,祝愿大家顺利。名师资料总结-精品资料欢迎下载-名师精心整理-第 3 页,共 3 页 -