《度量的概念及其可靠性bdmk.pptx》由会员分享,可在线阅读,更多相关《度量的概念及其可靠性bdmk.pptx(111页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第五章 度量与可靠性一、概念的度量二、指标与尺度三、尺度设置四、度量的可靠性五、度量可靠性的评价六、提高可靠性的方法一、概念的度量 管理研究涉及各种抽象的概念(Constructs)。做管理研究,首先要对研究中涉及到的概念有准确而全面的把握和认识。为了正确地度量概念,首先必须明确概念域,在概念的定义中精确描述概念包含了什么以及要排除什么。然后通过操作化用可观测变量来反映概念。尺度 一个变量的取值范围或取值类别的集合称为“尺度”(Scale),给描述对象赋值的过程称为“度量”(Scaling),度量既基于理论又基于经验。操作性描述就是在理论框架的基础上选择合适的变量与尺度反映抽象概念。概念度量面
2、临的困难 操作性描述必须具有客观性,在给定条件下要可以重复操作并能得出相同或相近的结果。要找到一种尺度去度量某个抽象概念往往是困难的,很难找到合适的可测度变量充分反映一个理论概念所包含的意思。操作性描述永远不会是完全恰当的。(如诊病)概念度量面临的困难 由于变量受环境及测试方法等各种因素的影响,使得每个测量都有偏差。强调度量的可重复性和客观性并不能保证度量的真实性,每个测量结果都只是对真实状况的一种逼近。操作性描述具有不充分性,不存在十全十美的度量抽象概念的方法。只靠改进测度方法本身难以解决度量的有效性问题。概念度量与理论的关系 理论与具体的度量操作是两个不同的层次,理论概念是一切度量的起点。
3、理论概念通常是从一组相关原理派生出来的,需要用抽象的、理论上的相关概念来描述。在进行操作性描述之前,首先要构造一个逻辑框架,即先假设一个命题,作为研究的出发点。概念度量与理论的关系 构造假设命题的主要依据可以是已有的公理或理论。假设命题通常是因果关系命题,研究的目的是要证明假设成立与否,构成假设的基本元素通常就是概念。由于具体的量度往往不能充分反映理论概念的丰富内涵,因而,不能反过来用操作性描述的结果来描述抽象的理论概念。例如,对“智商”这一抽象概念,不能定义为“智力测验的结果”。变量与概念之间的关系 单一变量不能包含概念的所有相关方面。同时,变量会涉及一些与拟测度概念无关的方面。单一变量通常
4、不能提供唯一正确的度量。变量与抽象概念可能是线性关系,也可能是非线性关系。例如:“年薪”与“激励强度”之间的关系。关于概念的相关知识可以用来指导我们对度量方法和变量的选择。比如,在黑夜用一把夜光尺去测量一头大象的身体。根据测量去描画这头大象,图中的一部分是来自我们已有的有关大象形状和大小的知识。二、指标与尺度 指标和尺度都用于对变量的测度,对变量的度量一般包括一个以上的指标和尺度。一个指标反映所测度变量的某一个方面的内容,指标的取值是由尺度来表示的。在被测度内容上的值域范围或取值的类别集称为尺度(scale)。尺度被用来反映事物现象在性质、规模方面的差异。指标与尺度举例 企业盈利能力是一个反映
5、企业这一分析单位属性的一个变量;反映这一变量的指标可以有净资产收益率、总资产报酬率、销售利润率、利润总额、净利润等。这些指标多度量分别使用比率尺度和货币尺度。用不同尺度表示的指标取值表明被测企业相对于其它企业在盈利能力方面的优劣程度。智商是一个反映个人这一分析单位属性的一个变量,智商得分是度量智商的一种尺度,智商得分是根据受试者对大量问题的回答给出的。尺度的表示 不同的指标常使用不同的尺度度量。为了对度量结果进行汇总、整理、计算、分析,常常要用数字来表示尺度。对某些抽象概念(如技术能力、竞争优势等)可以通过打分来度量。“有”、“无”或“高”、“低”是最简单的打分,可以用分别数字“1”和“2”来
6、表示。这些数字在不同情况下具体含义是不同的。度量的客观性不应被误解为定量化,并非所有量度都必须使用定量尺度,文字表述也可能是有效的。尺度的类别 按度量目的划分,管理研究中常用的尺度有评价尺度和态度尺度。按尺度的赋值是否需要与参照对象比较划分,尺度可分为比较式尺度和非比较式尺度。按尺度的赋值是否涉及受试者的偏好划分,尺度可分为偏好度量尺度和非偏好度量尺度。尺度的类别 尺度如果用数字表示,按数字的数学特性来划分,尺度大致可分为四类:分类尺度 次序尺度 差距尺度 比率尺度分类尺度 指用数字来反映现象的性质和类别的尺度。例如对性别进行分类,可用“1”和“2”分别代表男和女。这类尺度的数字之间不能进行任
7、何数学运算。次序尺度 指用数字来反映现象之间的等级和顺序的尺度。如文化程度,可分别用1、2、3、4、5、6来表示文盲、小学、初中、高中、大学、大学以上;这类尺度不仅能反映现象性质或类别上的差异,而且还能反映现象在高低、大小、强弱、先后等顺序上的差别。这类尺度的数字可用来比较大小,但还不能反映不同等级间的差异程度,不能进行加、减、乘、除等数学运算。差距尺度 指用数字定量反映现象之间差异程度的尺度。如用温度计的刻度来反映环境温度的高低。这类尺度的数字不仅能反映现象性质或类别上的等级和顺序差异,而且还能反映差异的数量化程度。这类尺度的数字之间可以进行加、减运算但不能进行乘、除运算。比率尺度 指用数字
8、反映现象之间存在的比例或比率关系。如出生率、工资增长率等概念就使用这类尺度。这类尺度一般用百分比来表示。尺度的数字之间不仅可以进行加、减运算而且可以进行乘、除运算。用比率尺度度量的现象特性中必须有绝对的或真实的“0”值存在,例如,人口增长率为“0”,就是真实的“0”值。在使用比率尺度时,必须加以分析和识别。如数学考试中成绩为“0”并不表示受试者数学能力一点没有,不存在真实的“0”值。使用不同度量尺度的变量 依不同的度量尺度,变量可分为定名变量、定序变量、定距变量和定比变量。定名变量:指用分类尺度度量的变量,变量的取值只包括有限的和互不包容的属性,如性别。定序变量:指用次序尺度度量的变量,取值可
9、以按某种逻辑进行顺序排列,但不能区分不同取值间的差距。使用不同度量尺度的变量 定距变量:指用差距尺度度量的变量,取值间的距离具有的实际意义。定比变量:指用比率尺度度量的变量,定比变量除具有上述三种变量的全部性质之外,还有一个具有实际意义的“0”点。三、尺度设置 尺度设置的目的是为研究者提供一个进行变量测度的参照标准或形式。比如,为测试家庭经济水平,可以设计这样一个尺度:1.贫穷;2.一般;3.富裕。尺度设置直接关系到测试结果的可靠性及有效性。如果尺度设置不合理,测试结果就会失去意义。不存在完美无缺的度量方法,各种度量方法都只能近似代表研究对象。在尺度设置过程中经常要通过反复试用和对结果进行分析
10、,对度量方案加以修改。直接判定式尺度设置 比较简单的尺度设置方法是直接判定式尺度设置,即测试时直接从所设尺度中选择一个值(答案)作为测试结果。上面所举的测试家庭经济水平的例子就是直接判定式尺度设置。尺度设置常用的具体方法有:图示尺度、条目化尺度、比较尺度图示尺度 将尺度用图示的办法表示出来,称图示尺度。例如,考察管理者的人际关系情况,可设计如下的图示尺度测试企业员工对管理者喜欢的程度。图示尺度 图中有尺度含义的提示,图上刻度的功能是作为对尺度等级位置的判断标准,而不是给出离散的类别。受试者根据自己的判断选择一个最能代表自己意见的尺度值。图示尺度是最广泛使用的方法之一。这种方法的优点是使用起来比
11、较方便,但测试结果的有效性较差,这是由于各人对“喜欢”的理解不同,或者说各人在判断时使用的“参照系”不同而造成的。使用图示尺度要避免过于极端的结论。条目化尺度 条目化尺度是选择一定数量的反映属性类别和属性强度的条目作为尺度的值。条目的设置数量以511 个为适宜。每一尺度值都被赋以或简略或详细的文字说明,受试者根据自己的理解选出合乎意愿的尺度值。尺度形式要根据拟研究问题和所需判断的类型决定。比如要测试员工对领导风格的看法,可以设置如下的尺度:(1)非常民主;(2)民主;(3)中庸;(4)独断;(5)非常独断。条目化尺度使用方便,但受到受试者所用“参照系”的影响,有效性较差。比较尺度 比较尺度明确
12、地要求通过与参照对象的的已知特征进行比较来做出判断。比如,要测试某人的领导才能。可以设置这样一个尺度:(1)与A(领导才能)最相近;(2)与B 最相近;(3)与C 最相近。在这种情况下,要求测试者对A、B、C 三人的情况了解得比较清楚。又如,要测试某项技术的先进程度。尺度值可以设置为(1)国际先进水平;(2)国内先进水平;(3)国内一般水平。比较尺度 在层次分析法中,测度人们对两项评价指标相对重要性判断的尺度为:(1)极端重要;(2)非常重要;(3)相当重要;(4)稍微重要;(5)同样重要。比较尺度的一种特殊情况是排序尺度(rank-orderscale),即对测试内容按一定标准进行比较排队,
13、如对重要程度、紧迫程度、喜爱程度等的排序。排序能很简单地表明特定对象按一定标准的顺序,使用这种尺度要求测试对象是有限的。比较尺度举例 你选择目前工作的理由是:工作有意义;待遇较高;有机会做创造性工作;有利于个人成长。对上述理由从1到4排序,1代表最有解释力。请对以下品牌的汽车从1到4排序,1代表你最想购买,4代表最不想购买。请将给以下电视机品牌打分,分数越高表示质量越好,满分为100分。多项目(multi-item)度量 由于概念通常具有多维性,而抽象概念的真实值无法直接测度,在概念已明确定义,概念域已确定的情况下,研究者要生成符合概念域的用来度量概念每个维度的项目集合。与概念域对应的项目集合
14、称为项目域。理论上,如果项目域中的项目与拟度量的概念维度和元素相对应,并且用项目域中的所有项目来度量概念,那么项目的度量值即为概念的真实值。这是不可能做到的。实际上,要从项目域中抽取项目样本,用样本项目的度量值估计概念的真实值。多项目(multi-item)度量 使用某种方式进行多次度量(比如要求回答多个相关的问题),再把这些度量或回答组合成变量的单一值的方法称为多项目度量。多项目度量可以对多维性概念进行测度和分析。在管理研究中,对复杂概念的度量,应尽量避免依靠单一的测度指标和测度方法,尽量使用多维的操作性描述,设计组合的指标和度量尺度,采取多种不同方法和度量项目来度量概念。多项目度量的必要性
15、 实际研究工作中,很难用单一的标准来度量复杂的变量,特别是观点和倾向这类复杂的变量。单一的标准只能提供某变量的大概情况,几种数据的组合则可以提供更全面更准确的情况。使用问卷调查时,没有任何一个问题可以单独描述一个变量。应当设计若干问题,每个问题代表变量的一部分。如果用定序尺度处理变量,单一的标准很难提供足够的类别,而由几项内容组成的指标和尺度却可以做到这一点。多项目度量的必要性 不同的度量方法可以相互验证,由于通常不同方法的偏差来源不相同,多项目度量有利于减少测量偏差,提高量度的可靠性和有效性。通过对采用不同指标和方法的度量结果进行对比分析,可以发现导致偏差的因素,进而有目的、有重点地选择和改
16、进测试方法。多项目尺度设置 内容的选择组合指标是用来度量变量的。选择指标内容的首要标准是逻辑上的正确性。例如要度量企业竞争力,选择的每项内容都应与企业竞争力有关。在选择内容时还要注意差异程度。如果就某项内容而言,企业之间没有明显差异,这项内容在组合指标时就不宜采用。多项目尺度设置 内容之间的关系要检验组合指标中不同内容之间的相关性。如果某项内容与其他内容完全不相关则应把它删去。而如果两项内容相关性太强,那么其中的一项就不必留在组合指标中。例如,研究企业的创新倾向,若研究对象在某项内容上表现出有较强的创新倾向,在另一项内容上也应大致具有这种倾向。即便不是如此,在甲内容上表现出创新倾向的研究对象在
17、乙内容上表现出创新倾向的可能性应当比在甲内容上表现出保守倾向的另一研究对象大一些。多项目尺度设置举例 例如,要研究商学院教授中“理论型”的教授与“实践型”的教授面向不同教学对象时的教学效果。需要对“理论型”和“实践型”的概念加以定义和度量。度量“理论型”和“实践型”的指标由三个问题组成。每个问题有两个选项,对每一问题的回答,选择第二选项的比选择第一选项的更重视理论。度量“理论型”和“实践型”的项目“作为商学院的教授你认为哪种能力对教学更重要:管理实践能力还是管理研究能力?”这一问题反映受试者对“最佳教学身份”的认识。“在提高业务能力方面,你的主要兴趣在于管理实践还是在于对基本管理理论的理解?”
18、这一问题反映受试者对“主要兴趣”的认识。“在管理研究领域你对案例研究的文章更感兴趣还是对探索管理理论的文章更感兴趣?”这一问题反映受试者对“阅读兴趣”的认识。度量项目之间的两两相关关系度量项目之间的两两相关关系 数据表明,87选择“研究者”作为最佳教学身份的受试者选择了“管理理论”作为业务兴趣。只有51选择“管理者”作为最佳教学身份的受试者选择了“管理理论”作为业务兴趣。这两项内容的差异为36。同样,阅读兴趣和业务兴趣之间关系的差异为38(7032),阅读兴趣与最佳教学身份之间关系的差异为21(3615)。最初这三个问题是由于逻辑上的正确性被选中的。通过对每对问题之间关系的检验,证明它们确实可
19、以成为同一变量的度量尺度。三项度量项目之间的关系研究对象按照最佳教学身份和阅读兴趣被分为四组,括号里的数字是各组人数。每个组的百分数表明最终兴趣在于管理理论的人所占的比例。表的左上角是理论倾向最弱的,表的右下角是理论倾向最强的。三项度量项目之间的关系(假设)上表中,加上阅读兴趣这项内容之后,业务兴趣和最佳教学身份之间的关系不变。如果这三项内容之间的关系如上表所示,阅读兴趣不能为这组指标增加任何新的信息,就不必保留了。上市公司财务指标相关性分析上市公司财务指标相关性分析多项目度量中要注意的问题 第一,项目必须根据经验与被测量的概念有关。第二,项目必须把对所测量维度持有不同观点的人区别开。第三,要
20、避免双关的或含糊的项目。第四,项目既要包括积极的也要包括消极的方向,使“同意”或“是”大致和“反对”和“不”各半,这样防止测量中的默许回答型(acquiescentresponsestyle)。指标分数的评定 当选定测度内容之后,接着要为不同的答案评定分数。评定分数过程中要做出两个决定:第一,决定指标取值的范围。例如,领导风格的取值范围可以从“非常民主”到“非常独断”。要注意平衡指标各个取值点之间的距离,使每一个点上有足够的个案。第二,决定每个问题的具体分数。一种作法是每个问题分数相等,另一种作法是对问题做加权处理。未详数据的处理处理未详数据(如填“不知道”)的方法有:第一,如果未详数据不多,
21、可以把它们删去。原则是保证还有足够的数据供分析用,同时要保证无系统偏差。第二,可以假定未详数据为某一种答案。如某问卷要求研究对象回答是否参加过某几项活动。有人只填写参加过的活动,没参加过的就空在那里。在这种情况下,可以假定空白处是“没有参加”。未详数据的处理 第三,仔细分析未详数据有可能发现它们所代表的意义。如在某些研究中,人们对某种观点填“不了解”实际上是“不同意”。要具体情况具体分析。第四,设中间数值为未详数据的数值,如在某指标数值为0、1、2、3时,可设未详数据为2;对连续型变量可用平均数为未详数据的数值。第五,可用随机数字作为未详数据的数值。指标的证实衡量对某一变量的度量成功与否的方法
22、是对指标的证实。证实组合指标可用下列方法:(1)内部证实证实指标首先是内部证实。方法是作一个表,以指标总得分为自变量,各项内容的得分为因变量,看其变化是否一致。如果某项内容得分与指标总得分相关系数很低则应删去。(2)外部证实再以关于商学院教授的研究为例。“理论型”指标高的受试者在其他问题上也应显示较强的理论倾向;“理论型”指标低的研究对象在其他问题上也应显示较低的理论倾向。指标的外部证实举例内容的相对重要性 组合指标中,并非所有的内容都同等重要。例如,反映企业偿债能力的指标可以包括利息保障倍数、资产负债率、流动比率、速动比率、强制性现金支出比率、到期债务支出比率、现金流动负债比率、现金总债务比
23、率等,这些指标的重要程度是不同的,对两个企业进行比较时,在8项指标中有5项指标较好的企业不一定偿债能力比另一个企业强。解决这一问题的办法是给指标加权或设置单项控制指标。根据组合指标对研究对象分类 当对研究对象进行二维或多维量度时,可以根据组合指标的量度结果对研究对象分类。例如,美国管理学家罗伯特 布莱克和简 穆顿在对领导行为的研究中根据“以任务为中心”和“以人员为中心”这两种领导风格的组合设计了著名的“管理方格图”,总结出5种典型的组合状态,反映出五种典型的领导方式。分类往往能够帮助我们理解数据,但应当注意最好以分类变量为自变量而不是因变量。管理方格图常用的多项目尺度设置方法 里克特(Like
24、rt)尺度 迦特曼(Guttman)尺度 保迦德斯(Bogardus)社会距离尺度 瑟斯滕(Thurstone)尺度里克特(Likert)尺度 里克特尺度是现代调查问卷中普遍采用的提问格式。它的基本形式是给出一个陈述,按照同意的程度进行项目排列。要求调查对象表明他“强烈赞成”、“赞成”、“反对”、“强烈反对”、或“未决定”。(也可不用“赞成”而用“同意”)。这种格式的特殊价值在于答案具有明确的顺序,且容易评定分数。有五种答案则评分为04或15。要注意评分的方向,对正面问题给“强烈赞成”者评5分;对反面问题给“强烈反对”者评5分。里克特(Likert)尺度 里克特度量要求概念是一维的,如果是多维
25、概念的话,要求将其细分成多个一维子集。里克特尺度可以是由一组问题组成,但每一问题都是一种观点判断,要求受试者在列出的赞成或反对的等级尺度中选择一值。里克特尺度设置方式举例上表是超市对顾客满意度的调查,里克特尺度的明显特征是,为避免产生偏差,所有题目都按“正向提问”和“反向提问”分成数目相等的两类,并分别以()和()号标识两种提问,最后分别统计()项题目得分及(一)项题目得分。使用里克特尺度度量的步骤 使用里克特尺度度量某一概念包括以下几步:明确要测量的态度涉及的基本理论概念;总结归纳出与态度有关的项目;要求被调查者作回答;计算分值;分析哪个项目对测量的可靠性和价值贡献最大。里克特尺度的优点和不
26、足 里克特尺度制作简单,用途广泛,结论可靠,调查内容有一定深度,可以用来测试具有多维尺度的内容,是一种应用范围比较广的方法。学校里让学生对教师的教学效果进行评估所用的调查问卷,往往也包括一组采用里克特尺度度量的问题。里克特尺度的不足是,没有给出关于主题接受范围的信息;当考虑多维的概念时,相同分数可能会由不同的观点组合产生的,即得分一样的结果,每道题的得分可能是不同或相反的(这不一定是一个缺点)。里克特尺度的变通形式 里克特尺度有许多变通形式,如“语义差异法”,它的题目是由两个词义相反的词组成,然后由测试者给出自己的认同程度分。使用里克特尺度有时会设置一些掩饰项目。项目的内容不一定要明显地与概念
27、有关,掩饰项目的作用是掩饰研究者的目的。但掩饰项目有其缺点:一是寻找相关性好又没有明显联系的微妙项目比较难;二是对结果会有干扰。除非有必要掩饰目的,最好不要用掩饰项目。语义差异度量 语义差异度量是里克特度量的一种变通形式,语义差异度量是通过对一个主题进行多角度回答来进行度量。语义差异度量要求人们在两个反义词中做选择,然后运用统计技术包括因子分析进行打分。对领导作风的语义差异度量举例为了避免系统偏差,最好不把看上去接近的词放在一侧。消费者对某超市态度的语义差异度量语义差异度量很有实用价值,其最普遍的应用是建立直观的图形轮廓。三维语义差异度量 语义差异判断也可以将一个概念分成三个维度。如,评价某一
28、个人或组织的行为,可以用社会价值评价、力量强度、主动性等三个维度度量。X 轴反映社会价值评价的好坏,Y 轴反映力量的强弱,Z轴反映积极和被动。用一个三维图像来反映各个项目程度。迦特曼(Guttman)尺度 迦特曼尺度又称累积度量。其特点是单调的,对调查对象的赞成与否是清楚的。与里克特尺度一样,迦特曼尺度也注重度量变量指标的强度。迦特曼尺度由一系列题目构成,每一题都有明确的文字说明,对每道题的内容受试者只能用“会”、“同意”或“不会”、“不同意”等来回答。迦特曼尺度是“累积”模式,每题具有一个尺度值(得分),题目之间具有高分题内容包含低分题内容的的关系,满足数值大的项目时,同时也满足小数值项目。
29、迦特曼尺度举例 比如数学能力测试中,可以设(1)加减法一题,(2)乘除法一题,(3)四则运算一题。这样受试者对每道题的回答结果只能是“会”或“不会”。而且会四则运算一般也会前两道题,这就是题目之间的包含关系。迦特曼尺度要求题目的设置是一维尺度,也就是说题目的内容都是反映单一内涵,而不具有多层含义。迦特曼尺度的优点 迦特曼尺度的优点是:测试结果具有单调性,对每一个测试项目的回答都反映了对所有项目回答的完整信息,知道一个人的测试得分情况,就可以推知该人对每一个问题的态度;测试结果也是对题目设置是否符合一维性的复核。如果排除随机误差后,测试结果不具有包含性,则说明题目设置不是迦特曼尺度。迦特曼尺度的
30、缺点 只能对一维尺度问题进行测试,多维问题不适用;对许多管理问题,设置迦特曼尺度较难把握问题的一维性;简单的随机误差会破坏累积模式,使得确定是否是“真”变得困难;受单调性特点的限制,如果某一人群态度模式不具备单调性质,或某一时刻是单调的,以后又不是单调的,测试就不具有有效性。迦特曼尺度适用的答案模式答案模式分为两种。反映了指标的趋强结构的答案模式称为“尺度型”答案模式未反映指标的趋强结构的答案模式称为“混合型”答案模式。迦特曼尺度适用于“尺度型”答案模式“指标得分”与“尺度得分”前例中对商学院教授理论倾向的度量,可以有两种评分方式。一种方式是每个问题分数相等,对选择“理论型”答案的给1分,选择“实践型”答案的给0分。所有得分加起来为总得分,这里称“指标得分”;另一种方式是按指标的趋强结构计分,在最强指标最佳教学身份上选择“理论型”答案的给3分,在次强指标业务兴趣上选择“理论型”答案的给2分,在最弱指标阅读兴趣上选择“理论型”答案的给1分,对各个问题的得分不相加,只计最高分,这里称“尺度得分”。