《2023年自考教育统计与测量.pdf》由会员分享,可在线阅读,更多相关《2023年自考教育统计与测量.pdf(14页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、里 受 对事物某方面特性的量的取值从总体上加以把握与认识。教 育 汨 录:对教育领域多种现象量的取值从总体上的把握与认识.是为教育工作的良好运行、科学管理、革新发展服务的。记 录 学 内 容:描述记录是通过列表归类、描绘图象、计算刻画数据分布特性与变量相依关系的记录量数,如平均数、原则差和有关系数等,把数据时分布特性、隐含信息,概括明确地揭示出来,从而更好地理解看待和使用数据。推断记录是教育记录的关键内容。怎样运用实际获得的样本数据资料,根据数理记录提供的理论和措施,来对总体的数量特性与关系作出推论判断,即进行记录估计和记录假设检查。迎 曼 按一定规则给对象在某种性质的量尺上的指定值。教 育
2、测 量:给所考察研究的教育对象,按一定规则在某种性质量尺上的指定值。比 率 量 尺:是一种有绝对零点的等单位的线性持续体系,其上的数字量化水平最高,全面具有可比可加可除性。原 则 化 测 验(测 验):测量工具、施测与评分程序、解释分数的参照体系都以科学地实现原则化。即代表性行为样本的客观而原则化的测验。原 则 化 考 试:教育条件下的心理特质是学业成就的原则化测量。量 表:原则化测验中的测量工具(考试卷或心理测试项目的集合)与解释分数时常模(或原则),均有物化的形态,合在一起称为量表。教育测量日勺特点:是间接性和要抽样进行。理解教育测量抓住:测量的成果就是给所测对象在一定性质的I量尺上的指定
3、值。要到达目的就要按照一定规则来进行一系列工作。工作怎样进行和能在什么性质量尺上指定值,归根究竟取决于所测对象自身的性质。数 据:用数量或数字形式体现的事实资料。数 据 种 类:来源分计数数据、测量评估数据、人工编码数据。反应的变量的性质分称名变量、次序变量、等距变量、比率变量数据。数据特点:离散性、变异性、规律性。计 数 数 据:以计算个数或次数获得的,多体现为整数。测量评估数据:借助测量工具或评估措施对事物的某种属性指派给数字后所得日勺数据。人 工 编 码 数 据:以人们按一定规则给不一样类别的事物指派合适时数字号码后形成的数据。称 名 变 量:阐明某一事物与其他事物在名称、类别或属性上的
4、不一样,不阐明事物之间差异的I大小、次序的先后及质欧J有劣。计算次数或个数,不能进行运算。次 序 变 量:就事物的某一属性的多少或大小按次序将各事物加以排列的变量,具有等级性和次序性的特点。数据之间有次序和等级关系,不具有相等的单位,也不具有绝对的数量大小和零点,进行次序递推运算。等 距 变 量:发明相对大小,相等的单位,零点相对,不能用乘除法反应数据之间的倍比关系。比率变量:具有量M l大小、相等的单位、绝对零点、进行运算,用乘除法处理数据,做比率描述。不一样性质的测 量 量 尺:名 义量尺(指定数字有类别标志意义,无性质优劣、分量多寡涵义,量化水平最低);次序量 尺(数字量化水平最高,有优
5、劣大小先后之别,单位不等,有可比性无可加性);等距 量 尺(数量化水平更高,数字是单位相等但零点可任意指定的线形持续体系上的值,有可比可加性无可除性);比 率 量 尺(是一种有绝对零点的等单位的线性持续体系,其上的数字量化水平最高,具有可比可加可除性)。次 数 分 布:一批数据中各个不一样数值所出现次数多少的状况,或者是这批数据在数轴上各个区间内所出现的次数多少的状况。编制次数分布.表日勺环节:求全距:数据中最大值与最小值之间的差距。定组数:确定把整批数据划分为多少个等距的区组,数据个数2 0 0个以内,组数取8-18组。定组距:全距与组数的比值取整数就是组距,取奇数或5的倍数。写出组限:每个
6、组的起止点界线,如10-15 (9、514、5)。求组中组:组中值等于(组实上限加组实下限)除以2,选奇数。归类划记:设计表格记录上述有关成果对数据归纳划记。登记次数。次 数 分 布 图 一 次 数 直 方 图:由若干宽度相等、高度不一的直方条紧密排列在同一基线上构成的图形。次数多边佟I:运用闭合的的折线构成多边形以反应次数变化状况的图示措施。合 计 次 数 曲 线 图 绘 制 环 节。1、纵轴为合计次数的量尺,横轴代表测验时分数量尺。2、对于“如下”分布来讲,各个坐标点的位置,其横坐标是各组的实上限,纵坐标是合计的次数。3、用持续光滑的曲线把点的轨迹连起来,再与横轴上最低组的实下限所在点连起
7、来,形成“S”形曲线。线 形 图 绘 制:、横轴代表自变量,纵轴代表因变量。2、根据有关记录事项的详细数据,在由纵横两轴所决定的平面上画记圆点,用稍粗的线段把相邻时点依次连接。3、在同一种图形中,可画若干条线(不超过3条)不一样的线形图,便于比较分析。用不一样的折线,在图形的合适位置上标明图例。次 数 多 边 图 制 作:1、画纵轴和横轴。两者长度之比5:3,纵轴为次数的量尺,横轴代表测验的分数量尺,并在横轴上最低组与最高组外各增长一种次数为0的组。2、在两轴所夹的直角坐标平面上,分别以每个组的组中值为横坐标,对应低次数为纵坐标,画出两个点。3、用线段把相邻的点依次连接起来,连同横轴,构成一种
8、闭合的多边形。记录分析图散 点 图:用平面直角坐标系上点的散布图形来表达两种事物之间的有关性及联络模式。适应描述二元变量的观测数据。线 形 图:以起伏的折线表达某种事物的发展变化及演变趋势的记录图。适于描述事物在时间序列上的变化趋势,藐视一种事物随另一事物发展变化的趋势模式,比较不一样人物团体在同一心理或教育现象上的变化特性几互相联络。条形 图:用宽度相似的长条表达各个记录事项之间数量关系的图形。用于描述离散性的记录事项。圆 形 图:以单位圆内各扇形面积占整个圆形面积的比例表达各记录事项在其总体中所占对应比例的I图示措施。用于描述具有比例构造数据。集 中 量 数:观测数据不仅具有离散性的特点,
9、并且在多数状况下具有向某点集中的的趋势,反应次数分布集中趋势的量数。作用一提供整个分布中多数数据的集结点位置,集中反应一批数据在整体上的数量大小,是一批数据的经典代表值。种类一算术平均数、中位数、众数。算 术 平 均 数:一批数据总和除以数据总次数所的的商。特 点(反应敏捷、确定严密、简要易懂、概括直观、计算简便、代数运算、应用普遍)。性质一数据组所有观测值与其平均数的离差之和为0。每一观测值都加上一种相似常数c计算变换后数据的平均数等于原有数据的平均数加上这个常数。每一观测值都乘上一种相似常数c所得新数据的平均数,其值等于原数据的平均数乘以这个常数。对每个观测值做线性变换,即乘上相似的常数,
10、再加上另一常数d,计算变换数据的平均数,其值等于原数据的平均数做相似线性变化后的成果。中位数:Mdn位于数据分布正中间位置上的数。特点:一根据所有数据的个数确定位置,意义简要,对排成次序的数据来讲,计算轻易。中数计算基于中间位置相邻的部分数据,不受极端数据的影响。次序变量的观测成果适合采用中数作为分布的集中量数。局限性一观测数据已分组归类或当原始数据分布中靠近中数附近有反复数据出现时,难以用观测法或简朴的措施确定中数。中数一般不适合于作代数运算。由于中数不受其数据分布中两端数据的影响,中数缺乏敏捷性。会用二数据分布中有个别异常值或极端值出现,用中数作代表值客观合理。在次数分布的某端或两端的数据
11、只有次数没有确切数量时,用中数作为次数分布的集中量数。在态度测验价值观测验或民意测验问卷测验中,向被调查对象提出某些事项,规定被调查对象对这些事项排序,在这些资料的信息数据整顿分析中,用中数指标概括各个事项的总体排序成果。众数一一种次数分布中出现次数最多的那个数M oo中数、众数、平均数经验公式:Mo=3Mdn-2Xo差 异 量 数:反应一组数据离散程度的量。差异量数作为一组数据离散程度的概括化特性量数,判断一组数据与其中心位置的平均差异程度;比较两组数据的离散程度;数据的中心位置一般用平均数或中数两个集中量数来刻画,差异量数与集中量数是互相联络的。差异量数大,阐明数据偏离集中量数所在位置的程
12、度也较大。差异量数小,说明集中量数的代表性很好。平均差、原则差、方差。离 中 趋 势:数据具有偏离中心位置的趋势,他反应一组数据自身的离散程度和变异性程度。平均差:各数据与其平均数的离差绝对值的平均值AD。从平均的角度反应了各个数据偏离中心位置的整体差异程度,直观易理解,科学性较强。实用性好,应用广泛。方 差:一组数据的离差平方数的算术平均数S2。原 则 差:一组数据方差的算术平方根用S表达。原 则 差 运 算 性 质。1、全组数据每一种观测值都加上一种相似的常数C后,计算得到的原则差不变。2、若每一种观测值都乘以一种相似的常数C后,所得到的原则差等于原原则差乘以这个常数的绝对值。3、每个观测
13、值都乘以同一种非零常数C,再加上另一种常数d,所得数据的原则差等于原原则差乘以这个常数C。差 异 系 数:把差异量数与集中量数两相比较后所形成的相对差异量数。CV=S/Xxl00o反应相对离散程度的系数,即相对差异量数,失去单位。地 位 量 数:反应次数分布中各数据所处地位的量。百 分 等 级(百 分 位)PR反应某个观测分数如下数据个数占总个数的比例的百分数,在0到100之间取值。口分位 数:位于特定百分中的相对地位的组内常模。未 归 类 数 据 确 定 各 数 比 例 环 节:1、把观测数据从大到小依次排列。2、按不一样的数据逐一记录次数,并列表记录。3、从低端开始向高端方向,计算各个观测
14、点数据如下的合计次数(不包括本得分点次数)4、计算各观测数据的“如下合计相对次数“,即比例数,计算措施是把“如下合计次数”c f除以数据总个数n。5、确定各观测点数据的百分等级P R,措施是把各数据的“如下合计次数”乘以100即可。难 度:被试完毕项目作答任务时所碰到的困难程度。难度指数:定量刻画一种测验项目的被试作答困难程度的量数。信 度:测验在测量它所测特质时得到的分数的一致性。测 验 效 度:测验实际上测到它打算要测的东西的程度。内 容 效 度:测验项目构成应测行为领域代表性样本的程度。效 标 关 联 效 度:测验预测个体在类似或某种特点情景下行为体现的有效度。构 造 效 度:测验测得心
15、理学理论所定义的某一心理构造或特质的程度。效标污 染:效标测量质的评估受到了测验分数值的信息的影响。随 机 现 象(不 确 定 现 象):相似条件下其成果也一定相似的现象。随 机 变 量:记录多种随机试验成果的变量(学生测验分数)。正 态 分 布:是持续性随机变量中常见的一种概率分布形态。正态分 布:iE态分布是由平均数和原则差唯一决定的,且平均数为0,原则差为1。从形态上看,是一条单峰、对称呈种形的曲线。其对称轴为过X=u的纵线。曲线在X=u点取的最大值。从X=u点开始,曲线向正负两个方向递减延伸,不停向X轴迫近,但永不与X轴相交,因此曲线在正负两个方向上都以X轴为渐进线。一般的正态分布可以
16、转化为原则正态分布。T分 布:单峰、对称呈种形的分布,对称轴过度布的平均数,曲线在正负两个方向上以横轴为渐进线,与正态相比T分布中间低而尖,两头高而平缓,特点是一族分布每一种T分布的形态受自由度的制约.对应一种自由度就有一种T分布,随自由度的增大,曲线的中间高而平缓,两头低而陡,曲线靠近正态分布,自由度靠近无穷大时,变成正态分布.X 2分布的)一 般 形 态,与 正 态 分 布 及T分 布 的 异 同 点:X 2分布一般是正态分布,X值永远不会有负值。Z分布,即正态分布与T分布均为对称分布,平均数所在时点是对称轴所通过的中心点。X 2分布是非对称分布,但与T分布曲线的形态伴随自由度d f变化而
17、有所变化同样,X 2分布曲线的形态也伴随自由度的变化而有所变化,但当自由度d f趋向无穷大时,X 2分布曲线就会变成一条正态分布曲线。总 体:客观世界中具有某种共同特性的J元素的全体。样 本:从总体中抽取的部分个体构成的群体。总 体 和 样 本 区 别:是不是具有同一特性的个体都已包括在所研究的j群体内,是的话该群体为总体,否则为样本。两者在同一研究中是绝对的。在不一样研究中两者的辨别又是相对的J。样本是总体的一部分,具有承接总体多种特性的固有特点,对总体具有代表性。影 响 样 本 对 总 体 代 表 性 日勺原因:总体自身的离散性:抽取样本容量的大小;抽样措施,随机抽样是一种优良的记录抽样措
18、施。简 朴 随 机 抽 样 原 则:机会均等,互相独立。分 髭 抽 样:总体较大,所抽样本容量比较小,总体内部构造复杂使用。原则是总体中各部分元素之间的)差异要不小于各部分元素之内的差异。实质是将总体中各部分按其容量在总体规模中的比分派到样本构造中去,然后抽样。长处是基本保持总体的分布形态。等距抽样:合用于总体很大样本较小总体无中间层次构造的抽样。抽 样 分 布:从一种总体中随机抽取若干个等容量的样本,计算每个样本欧J某个特性量数,由这些特性量数形成的分布,称为这个特性量数的抽样分布。平 均 数 的 抽 样 分 布:(1)原总体正态、总体方差已知。平均数抽样分布的I平均数等于原总体平均数,原则
19、差等于原总体原则差的n(根号)分之一.S E x=H n.(2)原总体正态,总体方差未知.t=X-W S E x.(3)原总体正态,样本较大参数:在总体数据基础上求取的多种特性量数。记 录 量:应用样本数据计算的多种特性量数。检 杳 记 录 量:根据检杳目的和抽样分布设计,专门用于记录假设检查的记录量。计 算 积 差 有 关 系 数 的 条 件:r X Y,适合于对两个持续变量之间的有关状况进行定量分析。1、样本容量要大(n 不小于3 0)。2、两列持续变量(比率变量或等距变量)。3、两总体分布呈正态。4、两变量之间存在线形关系。等级有关适应:r R,根据两列次序变量数据中各对等级数据的差计算
20、有关系数的措施。1、两列观测数据都是变量数据,或其中一列数据是次序变量数据,另一列数据是持续变量数据。2、两各持续变量的观测数据,其中有一列或两列数据的获得,只要依托非测量措施进行粗略评估得到。点 双 列有关适应:R p b。合用于双变量数据中。有一列数据是持续变量数据,如体重、身高以及许多测验与考试分数。另一列数据是二分类的称名变量数据,如性别、态度、学习经历、考试成果等数据。分 数:通过测量获得的、描述测量对象身心特性水平的数字。原始分数:在测量工具上直接得到的测值(数字)。教 育 与心 理 测 验 分 数-相对 评 分 分 数:通过被试间互相比较而确定意义的分数。绝 对 评 分 分 数:
21、通过拿被试测值跟应有原则作比较来确定其意义的分数。常 模:一定人群在测验所测特性上的普遍水平或水平分布状况。发展常模(年龄常模、年级常模)和组内常模(百分等级常模、原则分数常模)。常 模 建 立:科学抽样,从清晰明确地定义的特定人群总体中,抽取到容量足够大,有代表性的被试样组(原则化样组或常模组)。用拟建立常模的测验,采用规范化施册测手续与措施对原则化样组中的所有被试,实行测验,以便恰当精确地搜集所有被试在该测验上的实际测值。对搜集道德所有资料进行记录分析处理,把握被试样组在测验上的普遍水平或水平分布状况。原则分数赏模及单鱼原则分数是以它所属分数组的原则差为单位的,它所属分数组的平均数的距离。
22、原 则 分 数 常 模:用 被试所测的测验分数转换成的原则分数来揭示其在常模团体中的相对地位的组内常模。由于不管在一组分数分布的尾端还是中部,两原始测验分数之差若相等,转换出的原则分数时差也相等。即原则分数是等单位的量度,不存在尾端单位大而中部单位小的问题。原则分数是一种比值。分子是原始测验分数的离均差,它是会随测 验分数取值不一样而变化的;但分母却是一种固定值,是所属分数组的原则差,不随测验分数是在尾端或中部而变化,这样,就位置不一样测验分数的离均差来求比值时,被比的基数都是相似的。原 则 分 数:以它所属分数组的原则差为单位的,对它所属分数组的平均数的距离。测验常模及作用:一定人群在测验所
23、测特性上的普遍水平或水平分布状况。作用是解释测验分数意义的参照体系,通过将被试测验分数与常模比较来确定受测者的水平。1、科学抽样,清晰而明确低定义的“特定人群”总体中,抽取到容量足够大,并确具代表性的被试样组。2、用拟建立常模的测验,采用规范化实测手续与措施对原则化样组中的所有被试,实测该测验,以便精确搜集到所有这些被试在该测验上的实际测值。3、对搜集到的所有资料进行记录处理,真正把握被试样组在该测验上的一般水平或水平分布状况。组内常模:解释被试原始分数的)参照体系,以常模组的测验分数分布状态作为参照体系,阐明被试特质水平在常模组内的相对位置。分为百分等级常模和原则分数常模。Z值 作 线 形
24、变 换 的 必 要 及 措 施:一组测验分数转换成z 值后会出现负值与多位小数,可以明确测验分数在全组分数中的相对位置,但对一般人来说,体现成负值并带有多位小数的Z 值,不好理解,引起误会,因此不以便合用。措施是对所有要作变换的值,都乘以同一种确定值然后再都加上另一种确定时值。项 目 辨 别 度P=o、50被 试能助辛别。原则化常模参照测验目的是要尽量把握住被试的个别差异,因此但愿测验后所有被试的分数尽量拉开距离,好中差被试都能得到对应欧J彼此有足够差异的分数。测验项目的恰当难度应当是P 值尽量靠近0、50o测验项目的难度取值靠近0、5 0,项目难度的分布全距就狭窄,理想状态就是点状分布。因此
25、对一般常模参照测验,恰当难度就是P=0、5 0,测验所含项目的恰当难度分布,就是围绕P=0、5 0,这个点尽量作窄全距分布,被试才能最佳被辨别。项 目 辨 别 度 及 确 定:项目辨别度就是项目区别被试水平高下的能力的量度。确定项目辨别度是确定项目辨别度的原则是测验总分,要考察总分高的被试在该项目上与否也得高分,总分低时被试在该项目上与否也得低分即求取各个项目上被试的题分与测验总分的有关。测 验 信 度 及 影 响 信 度H勺原因:测验信度就是测验在测量它所测特质时得到的分数的一致性,它是对测验控制误差能力的量度,是反应测验性能的一种重要的质量指标。原因有:1、测验项目抽样不妥或语言体现引起误
26、解。2、施测环境影响。3、施测时指导语、完毕时限、主被式关系的影响。4、评分过程的偏向于误差。效度 种 类,内容效度:测验项目构成应测行为领域代表性样本的程度。效标关联效度:测验预测个体在类似或某种特点情景下行为体现的有效度。构造效度:测验测得心理学理论所定义的某一心理构造或特质的程度。学业成就测验分类及用途:安顿性测验学期教学或单元教学开始,确定学生实有水平针对性作好教学安排。学生与否具有成功学习这一课程或单元必须的基本知识和技能;对于学习的内容,已经理解和掌握那些内容,提醒教师处理教材;不一样学生的学习能力爱好习惯特点是什么,提供教学模式教学安排。形成性测9金教学进行过程中用于检查学生掌握
27、知识和进步状况。覆盖单元中有限的学习内容,用于改善学习和教学。为师生双方提供有关学习成败时持续反馈信息。对成功的学习起强化作用;暴露学习中局限性以便改正与完善。诊断性测9佥 探测与确定学习困难原因。区别-注重于与诊断有关的目的,对每一特定的目的需要包括大量题目,每个题目之间只有很小的差异。测验题目根据于对成功学习特殊技巧的详细分析以及常见的学习错误的分析研究。题目难度较低,重在确定学生所犯学习错误的类型以及学习困难本源所在。限于课堂教学中有限部分内容,按若干部分的测验分数与测验记录来分析。终止性测马 金 课程结束或教学大周期结束,确定教学目的到达程度和学生对预期学习成果掌握程度的测验。目的-对
28、学生的学习作出所有的检查总结,平定分数或等级;评价教师教学的有效性;预测学生后来学习状况。特点-包括广泛的教学内容,是一门课程或一种学期教学内容的有效抽样。具有更高的概括水平,不仅检查基本术语概念原理措施的掌握,还要从教学内容教学目的上检查运用知识分析处理问题的综合能力。题目内容有广泛性和代表性。题目的难度分布全距相对大某些。常模参照测验一参照着常模使用相对位置描述测验成绩水平的一种测验。鉴别与评价学生的能力发展水平,有助于个别差异的诊断与研究。用于教育工作中的选拔与分馆的决策。原 则 参 照 测 验 跟一组规定明确的知识能力原则或教学目的内容对比时,对学习者的测验成绩做出解释的测验。用途一阐
29、明学习者掌握所规定的教学内容的程度,以便做出掌握和未掌握,合格和不合格的分类决策。通过原则参照测验给学习者一种成绩,提供出学习者学习经历和已达水平的证明资料。评价课堂教学与课程编制的有效性。口头 测 验:使用特定语言回答问题的能力;综合有关信息提出问题的能力;论述观点为自己的观点作解释与辩护的能力;口头体现时思维及概括能力;知识理解的广度与深度;态度气质情感的特殊体现。措施 高 声朗诵;教师提问;题目签中随即抽选回答;按预设问题发言;小组讨论随意发言;一般会谈;根据图片或设置的情景讲故事;角色饰演。纸 笔 测 验:提高测验效率,大团体测验;完整记录学生在题目上做答的反应;便于实测和平分过程的规
30、范化原则化,提高学业成就测验的信度和效度;便于对测验题目信息做分析。缺 口 各 一 不能对学生的回答或观点做及时的问询,测量的教学目的,局限于认知领域,对于动作技能情感目的难以测量,对发展性目的中的心智技能重视不够。操 作 测 验:实践性为主原则、全面性原则、客观化原则。编 制 命 题 双 向 细 目 表 的 环 节:有关考试和考察目的的双向列联表,是有关一门课程教学内容和掌握层次两个维度下的考试。编制命题细目表一般以教学大纲或考试大纲为根据,重要环节是1、确定考试内容要目并把它排列在表中最左边一栏上。按教材章节名称罗列;根据教学内容知识块罗列。2、界定该科目考察的掌握目的层次从低到高排在表中
31、顶端第一行有关格子上。3、确定各项考试内容要目下的分数比重。4、把每一项考试内容的分数比重逐一分派到若干必要的考察目的即掌握层次上去,形成网格的分数分派方案。心 理 测 验:通过对一组原则刺激所引起的行为样组的客观分析,对人们的心理特性及个别差异进行估测、描述和诊断的措施。瑞 文 原 则 推 理 测 量 的 特 点:张厚粲专家主持,根据英国心理学瑞文1938年设计的“原则图形渐进测验 修订的一种非文字智力测验。合用的年龄范围宽,测验对象不受文化、种族与语言的限制,还可以用于生理缺陷者。测验可个别进行,也可团体实行。合用以便,省时省力,成果解释直观简朴,测验具有较高的信度与效度。明 显 性 水
32、平:在记录假设检查中,公认的小概率实践的概率值被称为记录假设检查的明显性水平。a值常取两个水平.a值小,假设检查的明显性水平高。小 概 率 事 件:概率取值不不小于0.05或不不小于0.01的随机事件。假设检查日勺环节:1、根据题目的设问提出检查假设。2、选定明显性水平a。3、根据检查目的和已知条件找到对应的抽样分布。4、写出检查记录量计算公式并按已知数据条件计算检查记录量值。5、根据明显性水平在抽样分布中确定临界值和危机域。6、将求得的检查记录量值域临界值作比较,根据其与否进入危机域作出与否拒绝虚无假设的记录结论。单 侧 检 查:为了推断某个总体参数与否不小于或不不小于某个定值,或者是为了推
33、断某两个总体参数之间有无不小于或不不小于的关系的检查。在抽样分布的一种尾侧设有临界值。危机域只有一块。双 侧 检 查:为了判断某个参数与否等于某个定值,或者是为了推断某两个参数与否相等的检查。记 录 决 策 的 两 种 错 误,控制减少出错误欧)原 因:在记录假设检查决策时也许犯的错误由两种类型:一种是虚无假设属真而被拒绝的错误。这种错误记录上称为I型错误,又称为“拒真”错误。另一种是虚无假设实伪而未被拒绝的错误,称为n型错误,又称为“纳伪”错误。要减少犯I型错误就是提高明显性水平即减少a的值,减少犯II型错误就要加大样本的容量。判 断 有 关 样 本 和 独 立 样 本:有关样本就是两总体有
34、关系数不等于0.独立总体就是两总体的有关系数等于0,在实际检查中,我们根据这两种状况来判断有关样本与独立样本。X 2记 录 量 公 式 及 意 义:X 2是。检查实际观测次数与理论期待次数之间差异程度的指标,体现式X2=XK/e/o表达实际观测的次数,/e表达理论期待次数;连加和X号上方的字母K表达K组数据连加。X 2检查的作用及环节:既适合于有参数的记录检查,也适合于无参数的记录检查。作用是基于实际观测次数和理论期待次数之间差异度的记录量实得值得概率考察。一是检查某抽样观测数据得分布与否与某一理论分布相一致,即总体分布得拟合良度检查。二是检查双向分类列联表数据下,两个分类特性之间是彼此有关还
35、是互相独立的问题,即独立性检验。环 节:1、根据所存在的问题,提出虚无假设(Ho)。2、最重要最关键一步是怎样从虚无假设(H。)出发,确定各类事物的理论期待次数。一般规定任何一类的理论次数不应不不小于5。3、根据X2记录量公式计算实得的X2值。4、选用合适明显性水平a 值,确定自由度d f,在X2值表中找到临界值X2。5、作出接受虚无假设或拒绝虚无假设的记录决策。原则:当公式确定的实得X2值不小于临界值X 2 a,可拒绝虚无假设(Ho),并接受研究假设(Ha)。当公式确定的实得X2值不不小于临界值X2a时 1 没有充足理由拒绝虚无假设(Ho),暂认为虚无假设是成立的,把虚无假设接受下来。X 2
36、 检查欧I自由度确定:在确定自由度时,组数K 我们已经明确,但约束条件取决于计算理论次数时附加的约束条件,或者说取决于零假设的建立,假如零假设中所指的正态分布是已知平均数N和原则差a 的分布,重要约束条件就只剩余规定具有相似的个总数n 这一条,这时就有自由度DF=K-1心 理 测 验 用 途:1、人才选拔。借助科学的心理测验措施,可以极大地提高选拔人才的精确性和效率。2、人员安顿与人事管理。不一样的职业活动,规定的心理素质不尽相似;不一样的个体,心理差异是客观存在的。人有其长也有其短。劳感人事部门要根据人的心理特点与专长分派工作。3、学校心理服务。把心理学与老式德育工作措施相结合优势互补,搜集
37、学生心理资料,理解其心理特点和个别差异;理解与评估学生能力构造及发展水平,探测职业能力倾向,开发天赋;理解特殊学生个体在特定环境下口勺心理问题。5、建立和检查假设。运专心理测验获取资料,验证研究人员提出的有关路论假设,通过对测验资料的科学分析,提出某些新的理论设想;研究行为与变量原因之间的联络模式,提出心理特性性和行为机制的理论构建。三、问答题1 客观题的I重要优缺陷是什么?优:客观;信息量大,覆盖面广;误差小信度高;适合测量明确的知识点。缺陷:难测高层次的心智技能;不易测文字体现和创新思维能力。2 试 述 教 育 测 量 与 教 育 评 价 之 间 的关 系。教育测量与教育评价之间有联络有区
38、别;教育测量侧重于量的规定性方面去把握事物;教育评价关注价值判断,包括优缺陷分析;教育测量是教育评价的基础;评价又是教育测量的延伸和功能释能;有些状况下教育测量自身就是系统的教育评价过程。3为 何 说 教 育 测 量 与 评 价 在 教 育 中 有 着 重 要 作 用?在教育素统中对实现教育目的起重要的作用;是课程改革的重要构成部分;教育改革常常把测量与评价的改革或反思作为突破口。4请 以 你 熟 悉 日 勺 一 门 课 程 试 卷 为 例 谈 一 下 怎 样 制 作 命 题 双 向 细 目 表?以教学内容和目的分类为维度并结合某门课程列出命题双项细目表,举例略5目前学校日勺学 生 课 业 考
39、 核 存 在 哪 些 重 要 问 题?过于强调选拔、措 施 单 考 核 抽 象 和 表 征 化。6、为 何 说 教 育 测 量 与 评 价 是 教 师 必备日勺知识技 能?对的评价学生是教师的一种职业能力;教师需要测量与评价的措施弥补非正式观测和书面考试的局限性;实践证明评价是所有成功教学的基础;发达国家教师教育普遍学习教育测量与评价之类的课程。7、怎 样 分 析,份 试 卷H勺内容效 度?是根据教育教学特性编制的,由评价指标、指标权重和评价原则等构成的工具。8、什 么 是 教 育 测 量?什么是教育评价?教育测量是针对学校教育影响下学生各方面的发展,侧重于量的规定性予以确定和描述的过程;教育
40、评价是按照一定的价值原则和教育目的,运用测量和非测量日勺种种措施系统地搜集资料信息,对学生的发展变化及其影响学生发展变化的多种要素进行价值分析和价值判断,并为教育决策提供根据的过程。9、按 解 释 成 果 的 参 照 点 分 类,教 育 测 量 与 评 价 可 分 为 哪 儿 类?并详细解释一下。常模参照测量与评价、原则参照测量与评价和潜力参照测量与评价。常模参照测量与评价是将被试的水平与测验常模相比较,以评价被试在团体中的相对位置的一种测量与评价类型;原则参照测量与评价是将被试的体现与既定的教育目的和行为原则相比较,以评价被试在多大程度上到达该原则的一种测量与评价;潜力参照测量与评价是将被试
41、实际水平与其自身潜在水平相比较,以评价其有无充足发挥自身潜力为目的。1 0.简 述 深 刻 理 解 教 育 测 量 必 须 抓 住 的 三 个 要 点。答:(1)测量的成果就是给所测对象在一定性质的量尺上指定值;(2)要到达这个目的就要按一定规则来进行一系列工作;(3)工作怎样进行和能在什么性质量尺上指定值,归根究竟取决于所测对象自身的性质。1 L 举 例 阐 明 什 么 是 绝 对 评 分 分 数。答:教育工作是一种有组织有目的的I活动,要努力追讨教育目的的到达。因此,在学校里拿被试在测试上的测值,去跟所测特性时应有原则作比较时事是诸多的。很显然,这时测验分数的意义,就完全取决于实得测值与应有原则的关系了。假如到达了规定,就是“合格 的或 己达标 的;假如未到达规定,就是 不合格 或 未达标 的。这里,全然不管其他被试在同一测验上所得测值怎样,他们达标与否丝毫不影响被试测验分数意义确实定。这种通过拿被试测值跟应有原则作比较来确定其意义时分数,就叫绝对评分分数。12.简 述 影 响II型 错 误 的 重 要 原 因。答:影响n型错误概率大小的原因有三个,(1)第一种原因是客观的真值与假设的伪值两者之间的差异。(2)影响n型错误概率大小的第二个原因是a值的大小。(3)影响II型错误概率大小的第三个原因是样本容量。