《《教育统计与测量评价》复习资料(10页).doc》由会员分享,可在线阅读,更多相关《《教育统计与测量评价》复习资料(10页).doc(10页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、-教育统计与测量评价复习资料-第 10 页教育统计与测量评价复习资料一、单项选择题1、观测数据为98、90、70、75、83、80,这组数据的全距是( C )。A、98 B、70 C、28 D、182、两个行为变量的观测值皆为顺序变量,则研究这两个变量之间的相关系数时,宜用( B )。A、积差相关系数 B、等级相关系数 C、点双列相关系数 D、双列相关系数3、在一批考试分数中,百分等级为76的分数是37分,这意味着比37分高的考生人数占全部考生总数比例是( A )。 A、24% B、37% C、63% D、76%4、在正态分布中,已知概率P(0Z1)0.34134,试问概率P(Z-1)的值为(
2、 D )。A、0.84134 B、0.65866 C、0.34134 D、0.158665、投掷一粒骰子,出现“4”点的概率是( A )。 A、1/6 B、1/4 C、1/2 D、16、测验蓝图设计是关于( B )A、测验内容和测验题型的抽样方案 B、测验内容和考查目标的抽样方案C、试验时间和测验题目的抽样方案 D、测验时间和考查目标的抽样方案7、面试共有6题并采用放回抽取原则,问两个考生抽取同为B题的概率为( D )。 A、1/6 B、1/12 C、1/18 D、1/368、每项评价指标在指标体系中所占的重要性程度,经量化后的值叫( A )A、权重 B、加权 C、标度 D、强度9、教育测量专
3、家格兰朗德认为,一个完整的评价计划,可以用公式加以形象地表达,其公式是( C )A、评价=测量+评定+价值判断 B、评价=测量+定量描述+定性判断 C、评价=测量+非测量+价值判断 D、评价=测量+非测量+统计推断10、复本信度和重测信度这两种方法的最大差别是( C )。A、不是同一批被试 B、计算误差大小C、不是同一份测验 D、计算方法11、积差相关系数的创立者是( A )。A、皮尔逊 B、斯皮尔曼 C、达尔文 D、高尔顿12、已知=5,=6,=7,=3,=4则等于( A )。A、16 B、20 C、21 D、2513、在一批考试分数中,百分等级为56的分数是65分,这意味着比65分高的考生
4、人数占全部考生总数比例是( B )。 A、36% B、44% C、56% D、65%14、下列分类属于按照测量与评价的内容划分的是(B )A、形成性与总结性测量与评价 B、智力与成就测量与评价C、常模参照与标准参照测量与评价 D、诊断性与个人潜能测量与评价 15、某班50名学生中有30名女生,问抽取一个学生恰好为男生的比例是(C )。 A、1/30 B、1/20 C、2/5 D、3/516、测验蓝图设计是关于( B )。A、测验内容和测验题型的抽样方案 B、测验内容和考查目标的抽样方案C、试验时间和测验题目的抽样方案 D、测验时间和考查目标的抽样方案17、Z分数量表是( B )。 A、称名量表
5、 B、等距量表 C、顺序量表 D、等比量表18、已知P(0Z1.96)=0.475,则P(|Z|1.96)概率值为( B )A、0.025 B、0.05 C、0.525 D、0.9519、重测信度的用途有时也在于评估所测特质在短期内的( C )。A、 有效性 B、可测性 C、稳定性 D、等值性20、教育测量专家格兰朗德认为,一个完整的评价计划,可以用公式加以形象地表达,其公式是( C )A、评价=测量+评定+价值判断 B、评价=测量+定量描述+定性判断 C、评价=测量+非测量+价值判断 D、评价=测量+非测量+统计推断21、有一组数据是测量身高的,一组是测量体重的,若比较两组数据的离散程度,则
6、用( D )。A、平均差 B、标准差 C、方差 D、差异系数22、某次考试之后对数据进行统计分析,求得第56百分位数是65分,这意味着考分高于65分的考生人数比例为( B )。A、35 B、44 C、56 D、6523、下列分类属于按照测量的内容划分的是( B )A、形成性与总结性测量与评价 B、智力与成就测量与评价C、常模参照与标准参照测量与评价 D、诊断性与个人潜能测量与评价 24、标准正态分布的平均数和标准差分别是( A )A、0 和1 B、-3和+3 C、-1和1 D、-4和+4 25、在正态分布中,已知概率P(0Z1)0.34134,试问:概率P(Z-1)的值为( B )。A、0.8
7、4134 B、0.65866 C、0.34134 D、0.1586626、测验蓝图设计是关于( B )A、测验内容和测验题型的抽样方案 B、测验内容和考查目标的抽样方案C、试验时间和测验题目的抽样方案 D、测验时间和考查目标的抽样方案27、同时掷两个骰子,出现12个点的概率为( D )A、1/6 B、1/12 C、1/18 D、1/3628、每项评价指标在指标体系中所占的重要性程度,经量化后的值叫( A )A、权重 B、加权 C、标度 D、强度29、教育测量专家格兰朗德认为,一个完整的评价计划,可以用公式加以形象地表达,其公式是( C )A、评价=测量+评定+价值判断 B、评价=测量+定量描述
8、+定性判断 C、评价=测量+非测量+价值判断 D、评价=测量+非测量+统计推断30、重测信度的用途有时也在于评估所测特质在短期内的( C )。B、 有效性 B、可测性 C、稳定性 D、等值性31.学习教育统计与测量对教育工作者十分重要,它是( A ) A.教育研究的重要方法与工具B.测量的重要方法与工具C.写文章的重要方法D.教学的重要手段32.假如我们希望通过一个统计表就能较方便地了解处于某个分数以下的人数,这时可编制一个( C )A.绝对次数分布表B.相对次数分布表C.累积次数分布表D.累积相对次数分布表33.下列数据中,不能进行加、减、乘、除运算,只可对每一类别计算次数或个数的是( A
9、)A.称名变量B.顺序变量C.等距变量D.比率变量34.适合显示各统计事项占总体比例的图形是( C )A.散点图B.条形图C.圆形图D.线形图35.下面属于地位量数的是( B )A.B.PRC.SD.36.提出等级相关法的统计学家是( D )A.布鲁姆B.皮尔逊C.比内D.斯皮尔曼37.百分等级数值是( D )A.名义变量B.顺序变量C.等距变量D.比率变量38.下列布鲁姆认知领域教育目标分类中,层次最低的是( A )A.知识B.领会C.应用D.分析39.利用韦克斯勒智力测验量表测查某校小学二年级学生,平均数为102,标准差为18,某学生得分为120,那么他的离差智商为( C )A.110B.
10、115C.120D.12540.是非题的特点是( C )A.不容易猜测B.评分误差大C.适用范围有限D.单位时间内答题量少41.标准参照测验的用途( D )A.用于教育工作的选拔决策B.用于教育工作分流决策C.用于鉴别学生能力D.用于评价课堂教育与课程编制的有效性42.吉尔福特根据研究得出,发散性思维在行为上表现出的特征有流畅性、变通性和( C )A.敢为性B.创造性C.独特性D.稳定性43.平均数的抽样分布近似服从正态分布所需的样本容量至少为( C )A.10B.20C.30D.4044.统计假设检验中,虚无假设又称为( A )A.零假设B.备择假设C.研究假设D.统计假设45.统计假设检验
11、中关于单侧检验描述不正确的是( A )A.显著性水平值平分在抽样分布两尾B.危机域只有一块C.检验目的为了推断某个总体参数是否大于某个定值D.抽样分布只有一个尾侧没有临界值二、概念解释 1散点图1画在平面直角坐标系中表示两种事物之间相互关系及联系模式的一种图示方法。2标准参照测量与评价2标准参照测量与评价是将被试的表现与既定的教育目标和行为标准相比较,以评价被试在多大程度上达到该标准的一种测量与评价。3教育测量3教育测量是针对学校教育影响下学生各方面的发展,侧重于量的规定性予以确定和描述的过程。 4教育评价4教育评价是按照一定的价值标准和教育目标,利用测量和非测量的种种方法系统地收集资料信息,
12、对学生的发展变化及其影响学生发展变化的各种要素进行价值分析和价值判断,并为教育决策提供依据的过程。5测验的效度5测验能测出所欲测特质的程度,相对于某种测量目标而言。6等距变量6 除了能表明量的大小外还具有相等的单位,而且其零点是相对的。7标准化测验 答:如果测量工具、施测与评分程序、解释分数的参照系(或标准)都已科学地实现标准化,也就是说,这种代表性行为样本的客观而标准化的测量,就称之为标准化测验。8.组内常模 答:组内常模是解释被试原始分数的参照体系,即被试所属那类群体的人(实际上即常模组被试)在所测特性上测验取值(也就是分数)的分布状况;拿被试分数跟这种分数分布状况作对比,就能揭示出被试在
13、其所属那类群体(即常模组)中的相对地位。9学习能力倾向测验答:学习能力倾向测验旨在测量一般的学习能力和潜力,即是否具备较好的进一步学习与研究的潜在能力,而不是已在学校中学到了多少知识。10显著性水平 答:在统计假设检验中,公认的小概率事件的概率值被称为统计假设检验的显著性水平。三、问答题 1客观题的主要优缺点是什么?优:客观;信息量大,覆盖面广;误差小信度高;适合测量明确的知识点。 缺点:难测高层次的心智技能;不易测文字表达和创新思维能力。2试述教育测量与教育评价之间的关系。教育测量与教育评价之间有联系有区别;教育测量侧重于量的规定性方面去把握事物;教育评价关注价值判断,包括优缺点分析;教育测
14、量是教育评价的基础;评价又是教育测量的延伸和功能释能;有些情况下教育测量本身就是系统的教育评价过程。3为什么说教育测量与评价在教育中有着重要作用?在教育系统中对实现教育目标起重要的作用;是课程改革的重要组成部分;教育改革常常把测量与评价的改革或反思作为突破口。4请以你熟悉的一门课程试卷为例谈一下怎样制作命题双向细目表?以教学内容和目标分类为维度并结合某门课程列出命题双项细目表,举例略5当前学校的学生课业考评存在哪些主要问题?过于强调选拔、方法单一、考评抽象和表征化。6、为什么说教育测量与评价是教师必备的知识技能? 正确评价学生是教师的一种职业能力;教师需要测量与评价的方法弥补非正式观察和书面考
15、试的不足;实践证明评价是所有成功教学的基础;发达国家教师教育普遍学习教育测量与评价之类的课程。7、怎样分析一份试卷的内容效度?是根据教育教学特性编制的,由评价指标、指标权重和评价标准等构成的工具。8、什么是教育测量?什么是教育评价?教育测量是针对学校教育影响下学生各方面的发展,侧重于量的规定性予以确定和描述的过程;教育评价是按照一定的价值标准和教育目标,利用测量和非测量的种种方法系统地收集资料信息,对学生的发展变化及其影响学生发展变化的各种要素进行价值分析和价值判断,并为教育决策提供依据的过程。9、按解释结果的参照点分类,教育测量与评价可分为哪几类?并具体解释一下。常模参照测量与评价、标准参照
16、测量与评价和潜力参照测量与评价。常模参照测量与评价是将被试的水平与测验常模相比较,以评价被试在团体中的相对位置的一种测量与评价类型;标准参照测量与评价是将被试的表现与既定的教育目标和行为标准相比较,以评价被试在多大程度上达到该标准的一种测量与评价;潜力参照测量与评价是将被试实际水平与其自身潜在水平相比较,以评价其有无充分发挥自身潜力为目的。10简述深刻理解教育测量必须抓住的三个要点。 答:(1)测量的结果就是给所测对象在一定性质的量尺上指定值;(2)要达到这个目的就要按一定规则来进行一系列工作;(3)工作如何进行和能在什么性质量尺上指定值,归根到底取决于所测对象本身的性质。11举例说明什么是绝
17、对评分分数。答:教育工作是一种有组织有目的的活动,要努力追求教育目标的达成。所以,在学校里拿被试在测试上的测值,去跟所测特性的应有标准作比较的事是很多的。很显然,这时测验分数的意义,就完全取决于实得测值与应有标准的关系了。如果达到了要求,就是“合格”的或“已达标”的;如果未达到要求,就是“不合格”或“未达标”的。这里,全然不管其他被试在同一测验上所得测值如何,他们达标与否丝毫不影响被试测验分数意义的确定。这种通过拿被试测值跟应有标准作比较来确定其意义的分数,就叫绝对评分分数。12.简述影响型错误的主要因素。答:影响型错误概率大小的因素有三个,(1)第一个因素是客观的真值与假设的伪值两者之间的差
18、异。(2)影响型错误概率大小的第二个因素是a值的大小。(3)影响型错误概率大小的第三个因素是样本容量。四、计算题(需写出详细计算过程)1采用两端组法确定考试题目的区分度和难度,假定37名学生参加考试,其中10名(占总人数37名的27%)高分组学生和10名低分组学生在最后一道论述题(满分值W=12分)上的得分如附表所示,试计算该题目的区分度和难度。区分度D=PHPL;难度D=(PH+PL)/2表2:高分组与低分组论述题得分统计表高分组1079989610910低分组4623510476区分度D=PHPL=0.725-0.32=0.405;难度D=(PH+PL)/2=(0.725+0.32)/2=
19、0.522已知某选拔考试参加人数为1000人,成绩呈正态分布,平均分为75,标准差为10。若只能有100人进入面试,问面试分数线定多少合适?若有人考了65分,问该人在团体中处于什么位置(百分等级是多少)?解:由题意可知求点双列相关n=10,p=6/10,q=4/10, P=(75+57+73+65+63+67)/6=66.67, q =(67+56+61+65)/4=62.25S=5.8rpb=(P -q)/Sx=(66.67-62.25)/5.80.60.4=0.372所以区分度不明显。3采用两端组法确定考试题目的区分度和难度,假定52名学生参加考试,其中14名(占总人数52名的27%)高分
20、组学生和14名低分组学生在最后一道论述题(满分值W=10分)上的得分如附表所示,试计算该题目的区分度和难度。区分度D=PHPL;难度D=(PH+PL)/2高分组(14人)10799896108889108低分组(14人)46235104320763区分度D=PHPL=0.85-0.33=0.52;难度D=(PH+PL)/2=(0.85+0.33)/2=0.594某次考试中选择题与总考试成绩如下表,求该选择题的区分度。 (教育测量学中试题的区分度以题目得分与试卷总分的相关系数表示)考生ABCDEFGHIJ选择题得分1111001001总成绩75577365675663616567(公式:)解:由
21、题意可知求点双列相关n=10,p=6/10,q=4/10, P=(75+57+73+65+63+67)/6=66.67, q =(67+56+61+65)/4=62.25S=5.8rpb=(P -q)/Sx=(66.67-62.25)/5.80.60.4=0.372所以选择题区分度0.372。5某次高考模拟试卷高一的5名学生做所用时间分别为170、120、110、160、130分钟;高三的5名学生做所用时间分别为50、70、90、55、45分钟;问高一和高三哪一组离散程度大?解:所以高三学生离散程度大。6教育测量学中试题的区分度以题目得分与试卷总分的相关系数表示,下表是一次测验的有关数据:考生
22、ABCDEFGHIJ第一题1111001001被试得分75577365675663616567已知第一题为选择题,试求其区分度。(公式:)解:由题意可知求点双列相关n=10,p=6/10,q=4/10, P=(75+57+73+65+63+67)/6=66.67, q =(67+56+61+65)/4=62.25S=5.8rpb=(P -q)/Sx=(66.67-62.25)/5.80.60.4=0.372所以区分度不明显。7某市举行选拔考试,共1000人参加,已知此次考试平均分为60分,标准差为10,问(1) 如果只录取100人,那么录取分数线定为多少合适?(2)如果某人考了70分,但只能有
23、150人参加面试,问该人是否能进入面试?解:根据标准分数公式 面试分数线为72.8Z=1,P=0.34134 面试人比例为50%-34.134%=15.866%;159人。不能进入面试五假设检验1男女生各一组参加某推理测验,已知该测验呈正态分布且总体方差相等。男生15人,平均分和标准差分别为82和9;女生13人,平均分和标准差分别为85和11。问男女生在该测验得分有无显著差异? (a=0.05,自由度为26时,t的临界值为2.056) 检验统计量:附表1: 正态分布表:ZYPZYP00.398940.000001.070.225060.357690.210.390240.083171.280.
24、175850.399730.250.386670.098711.290.173600.401470.260.385680.102571.960.058440.4750010.241970.3413420.053990.477252对男女大学生进行某测试(已知该测试成绩服从正态分布且总体方差相等)其结果如下,试在=0.05显著水平上检验男女生在该测试上是否存在显著的差异。n平均数方差男 生女 生13158582119(a=0.05,自由度为26时,t的临界值为2.056) 检验统计量:附表1: 正态分布表:ZYPZYP00.398940.0000010.241970.341340.100.396
25、950.039831.070.225060.357690.210.390240.083171.280.175850.399730.250.386670.098711.290.173600.401470.260.385680.102571.960.058440.475000.50.352070.1914620.053990.47725五、1、解:提出假设H0 : 1 = 2 H1 : 1 2 根据显著性水平查表确定临界值t=2.056比较统计量与临界值可知未落入危机域,所以男女学生在测验上得分无显著差异。2、解:作假设: H0:1=2,H1:12统计量已知=0.05,查表得t0.05/2(26)=2.056比较,所以接受原假设,所以没有差异。