《2022年自考《教育统计与测量》 .docx》由会员分享,可在线阅读,更多相关《2022年自考《教育统计与测量》 .docx(10页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、精选学习资料 - - - - - - - - - 统计: 对事物某方面特性的量的取值从总体上加以把握与熟识;训练统计: 对训练领域各种现象量的取值从总体上的把握与熟识 新进展服务的;,是为训练工作的良好运行、科学治理、革统计学内容:描述统计 是通过列表归类、描画图象、运算刻画数据分布特点与变量相依关系的统计量数,如平均数、标准差和相关系数等,把数据的分布特点、隐含信息,概括明确地揭示出来,从而更好地懂得对待 和使用数据;推断统计 是训练统计的核心内容;如何利用实际获得的样本数据资料,依据数理统计供应的理论 和方法,来对总体的数量特点与关系作出推论判定,即进行统计估量和统计假设检验;测量:按肯定
2、规章给对象在某种性质的量尺上的指定值;训练测量:给所考查争论的训练对象,按肯定规章在某种性质量尺上的指定值;比率量尺:是一种有肯定零点的等单位的线性连续体系,其上的数字量化水平最高,全面具有可比可加可除性;标准化测验测验:测量工具、施测与评分程序、说明分数的参照体系都以科学地实现标准化;即代表性行为样本的客观而标准化的测验;标准化考试: 训练条件下的心理特质是学业成就的标准化测量;量表: 标准化测验中的测量工具考试卷或心理测试项目的集合与说明分数的常模或标准,都有物化 的形状,合在一起称为量表;训练测量的特点 :是间接性和要抽样进行;懂得训练测量抓住:测量的结果就是给所测对象在肯定性质的量尺上
3、的指定值;要到达目的就要依据肯定规 就来进行一系列工作;工作如何进行和能在什么性质量尺上指定值,归根究竟取决于所测对象本身的性质;数据:用数量或数字形式表现的事实资料;数据种类:来源分计数数据、测量评估数据、人工编码数据;反应的变量的性质分称名变量、次序变 量、等距变量、比率变量数据;数据特点: 离散性、变异性、规律性;计数数据: 以运算个数或次数获得的,多表现为整数;测量评估数据:借助测量工具或评估方法对事物的某种属性指派给数字后所得的数据;人工编码数据: 以人们按肯定规章给不同类别的事 物指派适当的数字号码后形成的数据;称名变量: 说明某一事物与其他事物在名称、类别或属性上的不同,不说明事
4、物之间差异的大小、次序的先 后及质的有劣;运算次数或个数,不能进行运算;次序变量: 就事物的某一属性的多少或大小按次序将各事物加以排列 的变量,具有等级性和次序性的特点;数据之间有次序和等级关系,不具有相等的单位,也不具有肯定的数量 大小和零点,进行次序递推运算;等距变量: 说明相对大小,相等的单位,零点相对,不能用乘除法反映数据之间的倍比关系;比率变量: 具有量的大小、相等的单位、肯定零点、进行运算,用乘除法处理数据,做比率描述;不同性质的 测量量尺:名 义量尺指定数字有类别标志意义,无性质优劣、重量多寡涵义,量化水平最低;次序量 尺数字量化水平最高,有优劣大小先后之别,单位不等,有可比性无
5、可 加性;等距量尺 数量化水平更高,数字是单位相等但零点可任意指定的线形连续体系上的值,有可比可加性无可除性; 比率量尺 是一种有肯定零点的等单位的线性连续体系,其上的数字量化水平最高,具有可比可加可除性; 次数分布: 一批数据中各个不同数值所显现次数多少的情形,或者是这批数据在数轴上各个区间内所显现的次数多少的情形;编制次数分布表的步骤:求全距: 数据中最大值与最小值之间的差距;定组数:确定把整批数据划分为多少个等距的区组,数据个数 200 个以内,组数取 8-18 组; 定组距: 全距与组数的比值取整数就是组距,取奇数或 5 的倍数; 写出组限: 每个组的起止点界限,如 10-15 9、5
6、 14、5; 求组中组: 组中值等于组实上限加组实下限除以 果对数据归纳划记;登记次数;2,选奇数;归类划记:设计表格记录上述有关结名师归纳总结 - - - - - - -第 1 页,共 8 页精选学习资料 - - - - - - - - - 次数分布图 次数直方图: 由假设干宽度相等、高度不一的直方条紧密排列在同一基线上构成的图形;次数多边图: 利用闭合的的折线构成多边形以反映次数变化情形的图示方法;累计次数曲线图绘制步骤;1、纵轴为累计次数的量尺,横轴代表测验的分数量尺;2、对于 “以下 ”分布来讲,各个坐标点的位置,其横坐标是各组的实上限,纵坐标是累计的次数;3 、用连续光滑的曲线把点的
7、轨迹连起来,再与横轴上最低组的实下限所在点连起来,形成“ S”形曲线;线形图绘制: 1、横轴代表自变量,纵轴代表因变量;2、依据有关统计事项的具体数据,在由纵横两轴所打算的平面上画记圆点,用稍粗的线段把相邻的点依次连接;3、在同一个图形中,可画假设干条线不超过 的适当位置上标明图例;3 条不同的线形图,便于比较分析;用不同的折线,在图形次数多边图制作: 1、画纵轴和横轴;二者长度之比 5:3,纵轴为次数的量尺,横轴代表测验的分数量尺,并在横轴上最低组与最高组外各增加一个次数为 0 的组;2、在两轴所夹的直角坐标平面上,分别以每个组的组中值为横坐标,相应低次数为纵坐标,画出两个点;3、用线段把相
8、邻的点依次连接起来,连同横轴,构成一个闭合的多边形;统计分析图 散点图: 用平面直角坐标系上点的散布图形来表示两种事物之间的相关性及联系模式;适应描述二元变量的观测数据;线形图: 以起伏的折线表示某种事物的进展变化及演化趋势的统计图;适于描述事物在时间序列上的变化趋势,藐视一种事物随另一事物进展变化的趋势模式,比较不同人物团体在同一心理或训练现象上的变化特点几相互联系;条形图: 用宽度相同的长条表示各个统计事项之间数量关系的图形;用于描述离散性的统计事项;圆形图: 以单位圆内各扇形面积占整个圆形面积的百分比表示各统计事项在其总体中所占相应比例的图示方法;用于描述具有百分比结构数据;集中量数:观
9、测数据不仅具有离散性的特点,而且在多数情形下具有向某点集中的的趋势,反映次数分布集中趋势的量数;作用 供应整个分布中多数数据的集结点位置,集中反应一批数据在整体上的数量大小,是一批数据的典型代表值;种类 算术平均数、中位数、众数;算术平均数:一批数据总和除以数据总次数所的的商;特点 反应灵敏、确定严密、简明易懂、概括直观、运算简便、代数运算、应用普遍;性质 数据组全部观测值与其平均数的离差之和为 0;每一观测值都加上一个相同常数 c 运算变换后数据的平均数等于原有数据的平均数加上这个常数;每一观测值都乘上一个相同常数 c 所得新数据的平均数,其值等于原数据的平均数乘以这个常数;对每个观测值做线
10、性变换,即乘上相同的常数,再加上另一常数 d,运算变换数据的平均数,其值等于原数据的平均数做相同线性变化后的结果;中位数: Mdn 位于数据分布正中间位置上的数;特点 依据全部数据的个数确定位置,意义简明,对排成次序的数据来讲,运算简洁;中数运算基于中间位置相邻的部分数据,不受极端数据的影响;次序变量的观测结果适合采纳中数作为分布的集中量数;不足 观测数据已分组归类或当原始数据分布中靠近中数邻近有重复数据显现时,难以用观看法或简洁的方法确定中数;中数一般不适合于作代数运算;由于中数不受其数据分布中两端数据的影响,中数缺乏灵敏性;适用 数据分布中有个别反常值或极端值显现,用中数作代表值客观合理;
11、在次数分布的某端或两端的数据只有次数没有准确数量时,用中数作为次数分布的集中量数;在 态度测验价值观测验或民意测验问卷测验中,向被调查对象提出一些事项,要求被调查对象对这些事项排序,在这些资料的信息数据整理分析中,用中数指标概括各个事项的总体排序结果;众数一个次数分布中显现次数最多的那个数Mo ;中数、众数、平均数体会公式:Mo=3Mdn-2X ;差异量数:反映一组数据离散程度的量;差异量数作为一组数据离散程度的概括化特点量数,判定一组数据与其中心位置的平均差异程度;比较两组数据的离散程度;数据的中 心位置通常用平均数或中数两个集中量数来刻画,差异量数与集中量数是相互联系的;差异量数大,说明数
12、据偏离集中量数所在位置的程度也较名师归纳总结 大;差异量数小,说明集中量数的代表性较好;平均差、标准差、方差;第 2 页,共 8 页- - - - - - -精选学习资料 - - - - - - - - - 离中趋势: 数据具有偏离中心位置的趋势,他反映一组数据本身的离散程度和变异性程度;平均差:各数据与其平均数的离差肯定值的平均值 AD ;从平均的角度反映了各个数据偏离中心位置的整体差异程度,直观易懂得,科学性较强;有用性好,应用广泛;方差: 一组数据的离差平方数的算术平均数 S2;标准差: 一组数据方差的算术平方根用 S 表示;标准差运算性质; 1、全组数据每一个观测值都加上一个相同的常数
13、 C 后,运算得到的标准差不变;2、假设每一个观测值都乘以一个相同的常数 C 后,所得到的标准差等于原标准差乘以这个常数的肯定值;3、每个观测值都乘以同一个非零常数 C,再加上另一个常数 d,所得数据的标准差等于原标准差乘以这个常数 C;差异系数:把差异量数与集中量数两相比较后所形成的相对差异量数;CV=S/X100;反映相对离散程度的系数,即相对差异量数,失去单位;位置量数: 反映次数分布中各数据所处位置的量;百分等级百分位PR 反映某个观测分数以下数据个数占总个数的比例的百分数,在0 到 100 之间取值;百分位数: 位于特定百分中的相对位置的组内常模;未归类数据确定各数百分比步骤:1、把
14、观测数据从大到小依次排列;2、按不同的数据逐个统计次数,并列表记录;3、从低端开头向高端方向,运算各个观测点数据以下的累计次数不包括本得分点次数4、计算各观测数据的“ 以下累计相对次数”,即比例数,运算方法是把“ 以下累计次数” cf除以数据总个数 n;5、确定各观测点数据的百分等级 PR,方法是把各数据的“以下累计次数” 乘以 100 即可;难度: 被试完成项目作答任务时所遇到的困难程度;难度指数:定量刻画一个测验项目的被试作答困难程度的量数;信度: 测验在测量它所测特质时得到的分数的一样性;测验效度: 测验实际上测到它准备要测的东西的程度;内容效度: 测验项目构成应测行为领域代表性样本的程
15、度;效标关联效度: 测验猜测个体在类似或某种特点情形下行为表现的有效度;结构效度: 测验测得心理学理论所定义的某一心理结构或特质的程度;效标污染: 效标测量质的评定受到了测验分数值的信息的影响;随机现象不确定现象:相同条件下其结果也肯定相同的现象;随机变量: 记录各种随机试验结果的变量同学测验分数;正态分布: 是连续性随机变量中常见的一种概率分布形状;正态分布: 正态分布是由平均数和标准差唯独打算的,且平均数为 0,标准差为 1;从形状上看,是一条单峰、对称呈种形的曲线;其对称轴为过 X=u 的纵线;曲线在 X=u 点取的最大值;从 X=u 点开头,曲线向正负两个方向递减延长,不断向 X 轴靠
16、近,但永不与 X 轴相交,因此曲线在正负两个方向上都以 X 轴为渐进线;一般的正态分布可以转化为标准正态分布;T 分布: 单峰、对称呈种形的分布 ,对称轴过分布的平均数 ,曲线在正负两个方向上以横轴为渐进线 ,与正态相比 T 分布中间低而尖 ,两头高而平缓 ,特点是一族分布每一个 T 分布的形状受自由度的制约 .对应一个自由度就有一个 T 分布 ,随自由度的增大 ,曲线的中间高而平缓 ,两头低而陡 ,曲线接近正态分布 ,自由度接近无穷大时 ,变成正态分布 . X2 分布的一般形状,与正态分布及 T 分布的异同点: X2 分布通常是正态分布,X 值永久不会有负值; 分布,即正态分布与 T 分布均
17、为对称分布,平均数所在的点是对称轴所经过的中心点;X2 分布是非对称分布,但与 T 分布曲线的形状随着自由度 df 转变而有所转变一样,X2 分布曲线的形状也随着自由度的改变而有所转变,但当自由度 df 趋向无穷大时,X2 分布曲线就会变成一条正态分布曲线;总体: 客观世界中具有某种共同特点的元素的全体;名师归纳总结 - - - - - - -第 3 页,共 8 页精选学习资料 - - - - - - - - - 样本: 从总体中抽取的部分个体组成的群体;总体和样本区分: 是不是具有同一特点的个体都已包含在所争论的群体内,是的话该群体为总体,否就为样本;二者在同一争论中是肯定的;在不同争论中两
18、者的区分又是相对的;样本是总体的一部分,具有承接总体各种特点的固有特点,对总体具有代表性;影响样本对总体代表性的因素:优良的统计抽样方法;总体本身的离散性;抽取样本容量的大小;抽样方法,随机抽样是一种简洁随机抽样原就:时机均等,相互独立;分层抽样: 总体较大,所抽样本容量比较小,总体内部结构复杂使用;原就是 总体中各部分元素之间的差异要大于各部分元素之内的差异;实质是 将总体中各部分按其容量在总体规模中的比分派到样本结构中去,然 后抽样;优点是 基本保持总体的分布形状;等距抽样:适用于总体很大样本较小总体无中间层次结构的抽样;抽样分布: 从一个总体中随机抽取假设干个等容量的样本,运算每个样本的
19、某个特点量数,由这些特点量数 形成的分布,称为这个特点量数的抽样分布;平 均数的抽样分布: 1原总体正态、总体方差已知;平均数抽样分布的平均数等于原总体平均数,标准差等于原总体标准差的n根号 分之一 .SEx= /n.2原总体正态 ,总体方差未知.t=X- / SEx.3原总体正态 ,样本较大 .参数: 在总体数据基础上求取的各种特点量数;统计量: 应用样本数据运算的各种特点量数;检验统计量:依据检验目的和抽样分布设计,特地用于统计假设检验的统计量;运算积差相关系数的条件:rXY ,适合于对两个连续变量之间的相关情形进行定量分析;1、样本容量要大n 大于 30; 2、两列连续变量比率变量或等距
20、变量;3、两总体分布呈正态;4、两变量之间存在线形关系;等级相关适应 :rR,依据两列次序变量数据中各对等级数据的差运算相关系数的方法;1、两列观测数据都是变量数据,或其中一列数据是次序变量数据,另一列数据是连续变量数据;2、两各连续变量的观测数据,其中有一列或两列数据的获得,只要依靠非测量方法进行粗略评估得到;点双列相关适应 :Rpb;适用于双变量数据中;有一列数据是连续变量数据,如体重、身高以及很多测验与 考试分数;另一列数据是二分类的称名变量数据,如性别、态度、学习经受、考试结果等数据;分数: 通过测量获得的、描述测量对象身心特性水平的数字;原始分数:在测量工具上直接得到的测值数 字;训
21、练与心理测验分数 -相对评分分数: 通过被试间相互比较而确定意义的分数;肯定评分分数: 通过拿被试测值跟应有标准作比较来确定其意义的分数;常模: 肯定人群在测验所测特性上的普遍水平或水平分布状况;进展常模年龄常模、年级常模和组内常 模百分等级常模、标准分数常模;科学抽样 ,从清晰明确地定义的特定人群总体中,抽取到容量足够大 ,有代表性的被试样组标准 常模建立:化样组或常模组;用拟建立常模的测验,采纳标准化施册测手 续与方法对标准化样 组中的全部被试,实施测验,以便恰当精确地收集全部被试在该测验上的实际测值;对收集道德全部资料进行 统计分析处理,把握被试样组在测 验上的普遍水平或水平分布状况;标
22、准分数常模及单位 :标准分数是以它所属分数组的标准差为单位的,它所属分数组的平均数的距离;标准分数常模: 用 被试所测的测验分数转换成的标准分数来揭示其在常模团体中的相对位置的组内常模;由于不管在一组分数分布的尾端仍是中部,两原始测验分数之差假设相等,转换 出的标准分数的差也相等;即标准分数是等单位的量度,不存在尾端单位大而中部单位小的问题;标准分数是一个比值;分子是原始测验名师归纳总结 分数的离均差,它是会随测验分数取值不同而变化的;但分母却是一个固定值,是所属分数组的标准差,不第 4 页,共 8 页- - - - - - -精选学习资料 - - - - - - - - - 随测验分数是在尾
23、端或中部而变化,这样,就位置不同测验分数的离均差来求比值 时,被比的基数都是相同的;标准分数: 以它所属分数组的标准差为单位的,对它所属分数组的平均数的距离;测验常模及作用 :肯定人群在测验所测特性上的普遍水平或水平分布状况;体系,通过将被试测验分数与常模比较来确定受测者的水平;作用是 说明测验分数意义的参照1、科学抽样 ,清晰而明确低定义的“特定人群 ”总体中,抽取到容量足够大,并确具代表性的被试样组;2、用拟建立常模的测验,采纳标准化实测手续与方法对标准化样组中的全部被试,实测该测验,以便精确收 集到全部这些被试在该测验上的实际测值;3、对收集到的全部资料进行统计处理,真正把握被试样组在该
24、测验上的一般水平或水平分布状况;组内常模 :说明被试原始分数的参照体系,以常模组的测验分数分布状态作为参照体系,说明被试特质水平 在常模组内的相对位置;分为百分等级常模和标准分数常模;Z 值作线形变换的必要及方法 :一组测验分数转换成 Z 值后会显现负值与多位小数,可以明确测验分数在 全组分数中的相对位置,但对一般人来说,表现成负值并带有多位小数的 Z 值,不好懂得,引起误会,所以不 便利适用;方法是对全部要作变换的值,都乘以同一个确定值然后再都加上另一个确定的值;项目区分度 P=0、50 被试能区分; 标准化常模参照测验目的是要尽可能把握住被试的个别差异,因此期望测验后全部被试的分数尽可能拉
25、开距离,好中差被试都能得到相应的彼此有足够差异的分数;测验项目的恰当难度应当是P 值尽量接近0、50;测验项目的难度取值接近0、50,项目难度的分布全距就狭窄,抱负状态就是点状分布;所以对一般常模参照测验,恰当难度就是 绕 P=0 、50,这个点尽量作窄全距分布,被试才能最好被区分;P=0、50,测验所含项目的恰当难度分布,就是围项目区分度及确定:项目区分度就是项目区分被试水平高低的才能的量度;确定项目区分度是确定项目区分度的标准是测验总分,要考察总分高的被试在该项目上是否也得高分,总分低的被试在该项目上是否也得低分即求取各个项目上被试的题分与测验总分的相关;测验信度及影响信度的因素:测验信度
26、就是测验在测量它所测特质时得到的分数的一样性,它是对测验掌握误差才能的量度,是反映测验性能的一个重要的质量指标;因素有: 1、测验项目抽样不妥或语言表达引起误会; 2、施测环境影响;3、施测时指导语、完成时限、主被式关系的影响;4、评分过程的偏向于误差;效度种类, 内容效度:测验项目构成应测行为领域代表性样本的程度;效标关联效度: 测验猜测个体在类似或某种特点情形下行为表现的有效度;结构效度: 测验测得心理学理论所定义的某一心理结构或特质的程度;学业成就测验分类及用途:安置性测验 -学期教学或单元教学开头,确定同学实有水平针对性作好教学支配;同学是否具备胜利学习这一课程或单元必需的基本学问和技
27、能;对于学习的内容,已经明白和把握那些内容,提示老师处理教材;不同同学的学习才能爱好习惯特点是什么,供应教学模式教学支配;形成性测验 -教学进行过程中用于检查同学把握学问和进步情形;掩盖单元中有限的学习内容,用于改良学习和教学;为师生双方供应有关学习成败的连续反馈信息;对胜利的学习起强化作用;暴露学习中不足以便改正与完善;诊断性测验 -探测与确定学习困难缘由;区分-注 重于与诊断相关的目标,对每一特定的目标需要包括大量题目,每个题目之间只有很小的差异;测验题目依据于对胜利学习特别技巧的具体分析以及常见的学习错误 的 分析争论;题目难度较低,重在确定同学所犯学习错误的类型以及学习困难根源所在;限
28、于课堂教学中有限部 分内容,按假设干部分的测验分数与测验记录来分析;终结性测验 -课程终止或教学大周期终止,确定教学目标到达程度和同学对预期学习结果把握程度的测验;目 的-对同学的学习作出全部的检查总结,平定分数或等级;评判老师教学的有效性;猜测同学以后学习情形;特点 -包含广泛的教学内容,是一门课程或一个学期教学内容的有效抽样;具有更高的概括水平,不仅检查基 本术语概念原理方法的把握,仍要从教学内容教学目标上检查运用学问分析解决问题的综合才能;题目内容有 广泛性和代表性;题目的难度分布全距相对大一些;名师归纳总结 - - - - - - -第 5 页,共 8 页精选学习资料 - - - -
29、- - - - - 常模参照测验 参照着常模使用相对位置描述测验成果水平的一种测验;鉴别与评判同学的才能进展水 平,有利于个别差异的诊断与争论;用于训练工作中的选拔与分馏的决策;标准参照测验跟一组规定明确的学问才能标准或教学目标内容比照时,对学习者的测验成果做出说明的 测验; 用途 说明学习者把握所规定的教学内容的程度,以便做出把握和未把握,合格和不合格的分类决策;通过标准参照测验给学习者一个成果,供应出学习者学习经受和已达水平的证明资料;评判课堂教学与课程编 制的有效性;口头测验:使用特定语言答复以下问题的才能;综合有关信息提出问题的才能;阐述观点为自己的观点作解 方法-高 释与辩护的才能;
30、口头表达时思维及概括才能;学问懂得的广度与深度;态度气质情感的特别表现;声朗读;老师提问;题目签中立即抽选答复;按预设问题发言;小组争论随便发言;一般会谈;依据图片或设 置的情形讲故事;角色扮演;纸笔测验: 提高测验效率,大团体测验;完整记录同学在题目上做答的反应;便于实测和平分过程的标准化 标准化,提高学业成就测验的信度和效度;便于对测验题目信息做分析;缺点 不能对同学的答复或观点做及 时的询问,测量的教学目标,局限于认知领域,对于动作技能情感目标难以测量,对进展性目标中的心智技能 重视不够;操作测验: 实践性为主原就、全面性原就、客观化原就;编制命题双向细目表的步骤:关于考试和考查目标的双
31、向列联表,是关于一门课程教学内容和把握层次两个维度下的考试;编制命题细目表通常以教学大纲或考试大纲为依据,主要步骤是 1、确定考试内容要目并 把它排列在表中最左边一栏上;按教材章节名称排列;依据教学内容学问块排列;2、界定该科目考查的把握目标层次从低到高排在表中顶端第一行有关格子上;3、确定各项考试内容要目下的分数比重;4、把每一项考试内容的分数比重逐一安排到假设干必要的考查目标即把握层次上去,形成网格的分数安排方 案;心理测验: 通过对一组标准刺激所引起的行为样组的客观分析,对人们的心理特点及个别差异进行估测、描 述和诊断的方法;瑞文标准推理测量的特点:张厚粲教授主持,依据英国心理学瑞文19
32、38 年设计的 “标准图形渐进测验 ” 修订的一种非文字智力测验;适用的年龄范畴宽,测验对象不受文化、种族与语言的限制,仍可以用于生理缺陷者;测验可个别进行,也可团体实施;适用便利,省时省力,结果说明直观简洁,测验具有较 高的信度与效度;显著性水平: 在统计假设检验中,公认的小概率实践的概率值被称为统计假设检验的显著性水平; 值常取两个水平 . 值小,假设检验的显著性水平高;小概率大事: 概率取值小于 0.05 或小于 0.01 的随机大事;假设检验的步骤: 1、依据题目的设问提出检验假设;2、选定显著性水平 a;3、依据检验目的和已知条件找到相应的抽样分布;4、写出检验统计量运算公式并按已知
33、数据条件运算检验统计量值; 5、依据显著性水平在抽样分布中确定临界值和危机域;6、将求得的检验统计量值域临界值作比较,依据其是否进入危机域作出是否拒绝虚无假设的统计结论;单侧检验: 为了推断某个总体参数是否大于或小于某个定值,或者是为了推断某两个总体参数之间有无大于或小于的关系的检验;在抽样分布的一个尾侧设有临界值;危机域只有一块;双侧检验: 为了判定某个参数是否等于某个定值,或者是为了推断某两个参数是否相等的检验;统计决策的两种错误,掌握降低犯错误的因素:在统计假设检验决策时可能犯的错误由两种类型:一种是虚无假设属真而被拒绝的错误;这种错误统计上称为 I 型错误,又称为“拒真 ”错误;另一种
34、是虚无假设实伪而未被拒绝的错误,称为型错误,又称为“纳伪 ” 错误;要降低犯 I 型错误就是提高显著性水平即削减 a的值,降低犯型错误就要加大样本的容量;名师归纳总结 判定相关样本和独立样本:相关样本就是两总体相关系数不等于0,独立总体就是两总体的相关系数等第 6 页,共 8 页- - - - - - -精选学习资料 - - - - - - - - - 于 0,在实际检验中,我们依据这两种情形来判定相关样本与独立样本; 2统计量公式及意义: 2是检验实际观测次数与理论期望次数之间差异程度的指标,表达式 X2= . -.e /.e .o 表示实际观测的次数,.e 表示理论期望次数;连加和 号上方
35、的字母 K 表示 K 组数据连加;X2 检验的作用及步骤:既 适合于有参数的统计检验,也适合于无参数的统计检验;作用是 基于实际观测次数和理论期望次数之间差异度的统计量实得值得概率考察;一是 检验某抽样观测数据 得分布是否与某一理论分布相一样,即总体分布得拟合良度检查;二是 检验双向分类列联表数据下,两个分类特点之间是彼此相关仍是相互独立的问题,即独立性检 验;步骤:1、依据所存在的问题,提出虚无假设H ;2、最重要最关键一步是如何从虚无假设论次数不应小于 5;H 动身,确定各类事物的理论期望次数;一般要求任何一类的理3、依据 X2 统计量公式运算实得的 X2 值;4、选取适当显著性水平 值,
36、确定自由度 df,在 X2 值表中找到临界值 X2;5、作出接受虚无假设或拒绝虚无假设的统计决策;原就:当公式确定的实得 X2 值大于临界值 X2a,可拒绝虚无假设 H ,并接受争论假设Ha;当公式确定的实得 X2 值小于临界值 X2a 时,没有充分理由拒绝虚无假设 H ,暂认为虚无假设是成立的,把虚无假设接受下来;X2 检验的自由度确定:在确定自由度时,组数 K 我们已经明确,但约束条件取决于运算理论次数时附加的约束条件,或者说取决于零假设的建立,假如零假设中所指的正态分布是已知平均数 和标准差 a 的分布,主要约束条件就只剩下要求具有相同的个总数 n 这一条,这时就有自由度 DF=K-1
37、;心理测验用途: 1、人才选拔;借助科学的心理测验方法,可以极大地提高选拔人才的精确性和效率;2、人员安置与人事治理;不同的职业活动,要求的心理素养不尽相同;不同的个体,心理差异是客观存在的;人有其长也有其短;劳动人事部门要依据人的心理特点与特长安排工作;3、学校心理服务;把心理学与传统德育工作方法相结合优势互补,收集同学心理资料,明白其心理特点和个别差异;明白与评估同学才能结构及进展水平,探测职业才能倾向,开发天赋;明白特别同学个体在特定环境下的心理问题;5、建立和检验假设;运专心理测验猎取资料,验证争论人员提出的有关路论假设,通过对测验资料的科学分析,提出一些新的理论设想;争论行为与变量因
38、素之间的联系模式,提出心理特点性和行为机制的理论构建;三、问答题1 客观题的主要优缺点是什么?优:客观;信息量大,掩盖面广;误差小信度高;适合测量明确的学问点;缺点:难测高层次的心智技能;不易测文字表达和创新思维才能;2 试述训练测量与训练评判之间的关系;训练测量与训练评判之间有联系有区分;训练测量侧重于量的规定性方面去把握事物;训练评判关注价值判定,包括优缺点分析;训练测量是训练评判的基础;评判又 是训练测量的延长和功能释能;有些情形下训练测量本身就是系统的训练评判过程;3 为什么说训练测量与评判在训练中有着重要作用?在训练系统中对实现训练目标起重要的作用;是课程改革的重要组成部分;训练改革
39、经常把测量与评判的改革或反思作为突破口;4 请以你熟识的一门课程试卷为例谈一下怎样制作命题双向细目表?以教学内容和目标分类为 维度并结合某门课程列出命题双项细目表,举例略5 当前学校的同学课业考评存在哪些主要问题?过于强调选拔、方法单一、考评抽象和表征化;6、为什么说训练测量与评判是老师必备的学问技能. 正确评判同学是老师的一种职业才能;教师需要测量与评判的方法补偿非正式观看和书面考试的不足;实践证明评判是全部胜利教学的基础;发达国家老师训练普遍学习训练测量与评判之类的课程;7、怎样分析一份试卷的内容效度?是依据训练教学特性编制的,由评判指标、指标权重和评判标准等构成的工具;名师归纳总结 8、
40、什么是训练测量?什么是训练评判?训练测量是针对学校训练影响下同学各方面的进展,侧重于第 7 页,共 8 页- - - - - - -精选学习资料 - - - - - - - - - 量的规定性予以确定和描述的过程 ;训练评判是依据肯定的价值标准和训练目标,利用测量和非测量的种种方 法系统地收集资料信息,对同学的进展变化及其影响同学进展变化的各种要素进行价值分析和价值判定,并为 训练决策供应依据的过程;9、按说明结果的参照点分类,训练测量与评判可分为哪几类?并具体说明一下;常模参照测 常模参照测量与评判是将被试的水平与测验常模相 量与评判、标准参照测量与评判和潜力参照测量与评判;比较,以评判被试
41、在团体中的相对位置的一种测量与评判类型;标准参照测量与评判是将被试的表现与既定的 训练目标和行为标准相比较,以评判被试在多大程度上到达该标准的一种测量与评判;潜力参照测量与评判是 将被试实际水平与其自身潜在水平相比较,以评判其有无充分发挥自身潜力为目的;10简述深刻懂得训练测量必需抓住的三个要点;答: 1测量的结果就是给所测对象在肯定性质的量尺上指定值;2要到达这个目的就要按肯定规章来进行一系列工作;3工作如何进行和能在什么性质量尺上指定值,归根究竟取决于所测对象本身的性质;11举例说明什么是肯定评分分数;答:训练工作是一种有组织有目的的活动,要努力追求训练目标的达成;所以,在学校里拿被试在测
42、试上的测值,去跟所测特性的应有标准作比较的事是很多的;很明显,这时测验分数的意义,就完全取决于实得测值与应有标准的关系了;假如到达了要求,就是“合格 ”的或 “已达 标”的;假如未到达要求,就是“ 不合格 ”或 “未达标 ” 的;这里,全然不管其他被试在同一测验上所得测值如 何,他们达标与否丝毫不影响被试测验分数意义的确定;这种通过拿被试测值跟应有标准作比较来确定其意义 的分数,就叫肯定评分分数;12.简述影响型错误的主要因素;答:影响型错误概率大小的因素有三个,1第一个因素2影响型错误概率大小的其次个因素是a 值的大小;是客观的真值与假设的伪值两者之间的差异;3影响型错误概率大小的第三个因素是样本容量;名师归纳总结 - - - - - - -第 8 页,共 8 页