《第九章测量与量表:非比较量表技术.pptx》由会员分享,可在线阅读,更多相关《第九章测量与量表:非比较量表技术.pptx(37页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、ChapterNineMeasurementAndScaling:Non-comparativeScalingTechniques第九章测量与量表:非比较量表技术赵冬阳讲师经济与管理学院西南财经大学市场营销博士生e-mail:sunny_ChapterObjectives学习目标1.描述非比较量表技术,区分连续链表技术和分项评分量表,并解释Likert量表、语义差别量表和斯坦普尔量表2.讨论在构造分项评分量表时所涉及的有关量表类别数目、平衡量表与非平衡量表、奇偶数类别、强制与非强制性选择、语言描述程度及量表的物理形式等决策问题3.讨论评价量表时所用的标准,并解释如何评估信度、效度和可推论性4.
2、讨论在国际背景下执行非比较量表时所要考虑的问题5.理解在构造非比较量表时所涉及的伦理道德问题6.讨论因特网和计算执行连续评分量表和分项评分量表时的应用2011/2/17ZHAODongyang Panzhihua University2ChapterOutline学习内容l概要l非比较量表技术l连续评分量表l分项评分量表lLikert量表l语义差异量表l斯坦普尔量表2011/2/17ZHAODongyang Panzhihua University3ChapterOutline学习内容l非比较分项评分决策l量表类别的数目l平衡量表与非平衡量表l类别的奇偶数l强制性评分量表与非强制性评分量l语言
3、描述的性质和程度l物理形式或结构l多项量表2011/2/17ZHAODongyang Panzhihua University4ChapterOutline学习内容l量表的评价 l测量的准确性l信度l效度l信度和效度的关系l推论性l量表技术选择 l数学推导的量表 8.9 SPSS窗口l小结2011/2/17ZHAODongyang Panzhihua University5Reliable?Valid?Generalizable?NoncomparativeScalingTechniques非比较量表技术使用非比较量表的调查对象采用任何他们认为合适的评分标准,不对被评价的物体与另一物体或一些指
4、定的标准进行比较。调查对象一次只评估一个对象,因此非比较量表经常被单胞量表。非比较量表由连续评分量表和分项评分量表组成2011/2/17ZHAODongyang Panzhihua University6ContinuousRatingScale连续评分量表Respondentsratetheobjectsbyplacingamarkattheappropriatepositiononalinethatrunsfromoneextremeofthecriterionvariabletotheother.连续评分量表也称为图示评分量表。调查对象通过在一条直线上的适当位置做出标记为物体评分。The
5、formofthecontinuousscalemayvaryconsiderably.连续量表的形式可能变化相当大。HowwouldyourateSearsasadepartmentstore?就百货商店而言,你将如何斯尔斯评分?Version1形式1Probablytheworst-I-Probablythebest可能最差-I-可能最好Version2形式2Probablytheworst-I-Probablythebest0102030405060708090100Version3形式3VerybadNeithergoodnorbadVerygoodProbablytheworst-I
6、-Probablythebest01020304050607080901002011/2/17ZHAODongyang Panzhihua University7PerceptionAnalyzer感知分析仪Arelativelynewresearchtool,theperceptionanalyzer,providescontinuousmeasurementof“gutreaction.”Agroupofupto400respondentsispresentedwithTVorradiospotsoradvertisingcopy.Themeasuringdeviceconsistsofa
7、dialthatcontainsa100-pointrange.Eachparticipantisgivenadialandinstructedtocontinuouslyrecordhisorherreactiontothematerialbeingtested.Astherespondentsturnthedials,theinformationisfedtoacomputer,whichtabulatessecond-by-secondresponseprofiles.Astheresultsarerecordedbythecomputer,theyaresuperimposedonav
8、ideoscreen,enablingtheresearchertoviewtherespondentsscoresimmediately.Theresponsesarealsostoredinapermanentdatafileforuseinfurtheranalysis.Theresponsescorescanbebrokendownbycategories,suchasage,income,sex,orproductusage.2011/2/17ZHAODongyangPanzhihuaUniversity8ItemizedRatingScales分项评分量表lTheresponden
9、tsareprovidedwithascalethathasanumberorbriefdescriptionassociatedwitheachcategory.lThecategoriesareorderedintermsofscaleposition,andtherespondentsarerequiredtoselectthespecifiedcategorythatbestdescribestheobjectbeingrated.lThecommonlyuseditemizedratingscalesaretheLikert,semanticdifferential,andStape
10、lscales.l提供给调查对象的分项评分量表上面每个类别都有一个数字或与每一个类别相关的简要描述。l类别按照量表的位置来排序,调查对象需要选出最能描述被评物体的特定类别。l通常使用的分项评分量表为Likert量表、语义差异量表和斯坦普尔量表。2011/2/17ZHAODongyangPanzhihuaUniversity9LikertScale利克特量表TheLikertscalerequirestherespondentstoindicateadegreeofagreementordisagreementwitheachofaseriesofstatementsaboutthestimul
11、usobjects.Theanalysiscanbeconductedonanitem-by-itembasis(profileanalysis),oratotal(summated)scorecanbecalculated.Whenarrivingatatotalscore,thecategoriesassignedtothenegativestatementsbytherespondentsshouldbescoredbyreversingthescale.利克特量表需要调查对象对关于刺激物体的一系列陈述中的每一个,指出同意或不同意的程度。分析可以逐项进行(轮廓分析),也可以对项目加总和计
12、算每位调查对象的总评分(求和)。需要对那些消极陈述的原始得分进行倒置转换2011/2/17ZHAODongyangPanzhihuaUniversity10百货商店项目:Likert量表Strongly Disagree强烈反对强烈反对Disagree反对反对Neither Agree nor disagree及不同意及不同意也不反对也不反对agree 同意同意Strongly agree 强烈赞成强烈赞成1.Searssellshigh-qualitymerchandise.西尔斯销售高质量的商品12X3452.Searshaspoorin-storeservice.西尔斯店内服务很差12X
13、3453.IliketoshopatSears.我喜欢在西尔斯购物123X45它易于执行。调查对象很容易理解如何使用量表,因而它适合邮件访谈、电话访谈或人员访谈。Likert量表有几个优点:比其他分项评分量表花费时间长。主要缺点:2011/2/17ZHAODongyang Panzhihua University11SemanticDifferentialScale语义差异量表lThesemanticdifferentialisaseven-pointratingscalewithendpointsassociatedwithbipolarlabelsthathavesemanticmeani
14、ng.lSEARSIS:lPowerful-:-:-:-:-X-:-:-:WeaklUnreliable-:-:-:-:-:-X-:-:ReliablelModern-:-:-:-:-:-:-X-:Old-fashionedlThenegativeadjectiveorphrasesometimesappearsattheleftsideofthescaleandsometimesattheright.lThiscontrolsthetendencyofsomerespondents,particularlythosewithverypositiveorverynegativeattitude
15、s,tomarktheright-orleft-handsideswithoutreadingthelabels.lIndividualitemsonasemanticdifferentialscalemaybescoredoneithera-3to+3ora1to7scale.l语义差异量表是一个7级评分量表,两端由极端的词组组成。l西尔斯是:l强有力的-:-:-:-:-X-:-:-:虚弱的l不可信的-:-:-:-:-:-X-:-:可信的l时髦的-:-:-:-:-:-:-X-:老式的l负面的形容词或短语有时出现在量表的左端,有时出现在右端。l这样控制了有些调查对象,尤其是那些有着极端正面或极
16、端负面态度的调查对象,不读标示就在左端或右端标记的倾向。l语义差异量表上的项目可以在一个-3到+3或1到7的尺度上评分。2011/2/17ZHAODongyangPanzhihuaUniversity12当度量某个商店、公司或品牌的形象时,语义差别量表形式是非常有用的在下列每组词中,画出最能反映你对在下列每组词中,画出最能反映你对*的印象的线条的印象的线条价格高_价格低不方便的位置_方便的位置适合我_不适合我舒适的环境_不舒适的环境菜单不够丰富_菜单足够丰富服务很快_服务很慢饭菜质量不好_饭菜质量不较高一个有特色的地方_一个普通的地方132011/2/17ZHAODongyang Panzhi
17、hua University调查结果14在下列每组词中,画出最能反映你对在下列每组词中,画出最能反映你对*的印象的线条的印象的线条价格高_价格低不方便的位置_方便的位置适合我_不适合我舒适的环境_不舒适的环境菜单不够丰富_菜单足够丰富服务很快_服务很慢饭菜质量不好_饭菜质量不较高一个有特色的地方_一个普通的地方2011/2/17ZHAODongyang Panzhihua UniversityASemanticDifferentialScaleforMeasuringSelf-Concepts,PersonConcepts,andProductConcepts测量自我概念、个人概念和产品概念的
18、一个语义差异量表1.Rugged:-:-:-:-:-:-:-:Delicate 2.Excitable:-:-:-:-:-:-:-:Calm3.Uncomfortable :-:-:-:-:-:-:-:Comfortable 4.Dominating:-:-:-:-:-:-:-:Submissive 5.Thrifty:-:-:-:-:-:-:-:Indulgent 6.Pleasant:-:-:-:-:-:-:-:Unpleasant 7.Contemporary :-:-:-:-:-:-:-:Obsolete 8.Organized:-:-:-:-:-:-:-:Unorganized 9.
19、Rational:-:-:-:-:-:-:-:Emotional 10.Youthful:-:-:-:-:-:-:-:Mature 11.Formal:-:-:-:-:-:-:-:Informal 12.Orthodox:-:-:-:-:-:-:-:Liberal 13.Complex:-:-:-:-:-:-:-:Simple 14.Colorless:-:-:-:-:-:-:-:Colorful15.Modest:-:-:-:-:-:-:-:Vain2011/2/17ZHAODongyang Panzhihua University15ASemanticDifferentialScalefo
20、rMeasuringSelf-Concepts,PersonConcepts,andProductConcepts测量自我概念、个人概念和产品概念的一个语义差异量表1.粗糙的 :-:-:-:-:-:-:-:精致的 2.兴奋的:-:-:-:-:-:-:-:冷静的3.不舒适的:-:-:-:-:-:-:-:舒适的 4.专横的:-:-:-:-:-:-:-:顺从的 5.节俭的:-:-:-:-:-:-:-:挥霍的 6.愉快的:-:-:-:-:-:-:-:不愉快的 7.现代的 :-:-:-:-:-:-:-:非现代的 8.组织的:-:-:-:-:-:-:-:无组织的 9.理性的:-:-:-:-:-:-:-:感
21、性的 10.年轻的:-:-:-:-:-:-:-:成熟的 11.正式的:-:-:-:-:-:-:-:非正式的 12.正统的:-:-:-:-:-:-:-:自由主义的 13.复杂的:-:-:-:-:-:-:-:简单的 14.无趣味的:-:-:-:-:-:-:-:多姿多彩的15.谦虚的:-:-:-:-:-:-:-:自负的2011/2/17ZHAODongyang Panzhihua University16StapelScale斯坦普尔量表TheStapelscaleisaunipolarratingscalewithtencategoriesnumberedfrom-5to+5,withoutane
22、utralpoint(zero).Thisscaleisusuallypresentedvertically.斯坦普尔量表是一个单极的评分量表,有10个从+5到-5编号的类别,没有中立点(零点)SEARS+5+5+4+4+3+3+2+2X+1+1HIGHQUALITY高品质POORSERVICE糟糕的服务-1-1-2-2-3-3-4X-4-5-5ThedataobtainedbyusingaStapelscalecanbeanalyzedinthesamewayassemanticdifferentialdata.用斯坦普尔量表获得的数据,可以用语义差异量表相同的方式进行分析。2011/2/1
23、7ZHAODongyang Panzhihua University17BasicNoncomparativeScales基本的非比较量表Table9.1量表量表基本特征基本特征例子例子优点优点缺点缺点连续评分量表在连续的线上做出标记商业电视的反应容易构建评分麻烦除非计算机化分项评分量表Likert量表从1(强烈反对)到5(强烈赞同)赞同的程度态度测量容易构建、执行和理解费时语义差异量表7级评分,两端由极端的词组组成品牌、产品及公司形象多变的取得的数据是否应该看作定距尺度存争议斯坦普尔量表单极,从+5到-5,没有中立点态度和形象的测量容易构建,经电话执行令人迷惑,难以应用2011/2/17ZH
24、AODongyang Panzhihua University18SummaryofItemizedScaleDecisions分项评分量表决策的小结Table9.2Number of categories Although there is no single,optimal number,traditional guidelines suggest that there should be between five and nine categories.Balancedvs.unbalancedIngeneral,thescaleshouldbebalancedtoobtainobjec
25、tivedataOdd/evenno.ofcategoriesIfaneutralorindifferentscaleresponseispossibleforatleastsomerespondents,anoddnumberofcategoriesshouldbeused.Forcedvs.non-forcedInsituationswheretherespondentsareexpectedtohavenoopinion,theaccuracyofthedatamaybeimprovedbyanon-forcedscale.VerbaldescriptionAnargumentcanbe
26、madeforlabelingallormanyscalecategories.ThecategorydescriptionsshouldbelocatedasclosetotheresponsecategoriesaspossiblePhysicalformAnumberofoptionsshouldbetriedandthebestselected.2011/2/17ZHAODongyang Panzhihua University19SummaryofItemizedScaleDecisions分项评分量表决策的小结Table9.2所用量表类别的数目一般建议类别的适宜数目是5至9之间平衡
27、表对非平衡表一般来说,为了获得可观的数据,量表应该是平衡的类别的奇数数目或偶数数目如果至少有一些调查对象可能有一种中立或无所谓的答案,则应该使用奇数的类别数目强制性选择与非强制性选择在预料到调查对象可能没有意见的情况下,数据的精确性可以通过一个非强制式量表得到改善。语言描述的性质和程度为所有或许多量表类别做标注会减少量表的不明确性。类别的描述应该放在离答案类别尽可能近的位置量表的外观形式应该尝试大量的选择,选出最好的一种2011/2/17ZHAODongyang Panzhihua University20BALANCEDANDUNBALANCEDSCALES平衡和非平衡量表FIG.9.1Ba
28、lancedScale平衡量表JovanMuskforMenis:Jovan男士香水是:Extremelygood-极好Verygood-很好Good-好Bad-差Verybad-很差Extremelybad-极差UnbalancedScale非平衡量表JovanMuskforMenis:Jovan男士香水是:Extremelygood-极好Verygood-很好Good-好Somewhatgood-略好Bad-差Verybad-很差2011/2/17ZHAODongyangPanzhihuaUniversity21Rating Scale Configurations评分评分表结构表结构-3
29、-10+1+2-2+3Cheer Cheer detergent is:Cheer detergent is:1)Very harsh -Very gentle 2)Very harsh 1 2 3 4 5 6 7 Very gentle 3).Very harsh .Neither harsh nor gentle .Very gentle 4)_ _ _ _ _ _ _ Very Harsh Somewhat Neither harsh Somewhat Gentle Very harsh harsh nor gentle gentle gentle 5)Very Neither hars
30、h Very harsh nor gentle gentleFig.9.22011/2/17ZHAODongyang Panzhihua University22Thermometer Scale 温度计量表温度计量表Instructions:Please indicate how much you like McDonalds hamburgers by coloring in the thermometer.Start at the bottom and color up to the temperature level that best indicates how strong you
31、r preference is.Smiling Face Scale 笑脸量表笑脸量表 Instructions:Please point to the face that shows how much you like the Barbie Doll.If you do not like the Barbie Doll at all,you would point to Face 1.If you liked it very much,you would point to Face 5.12345Like very muchDislike very much100 75 50 25 0Som
32、eUniqueRatingScaleConfigurations一些独特的评分图表结构Fig.9.32011/2/17ZHAODongyang Panzhihua University23Some Commonly Used Scales in Marketing市场营销中市场营销中一些常用的量表一些常用的量表Table9.3Construct结构ScaleDescriptors尺度描述Attitude态度Importance重要性Satisfaction满意度PurchaseIntent购买意向PurchaseFreq购买频率VeryBad很差NotatAllImportant一点也不重要V
33、eryDissatisfied很不满意DefinitelywillNotBuy绝对不买Never从不Bad差NotImportant不重要Dissatisfied不满意ProbablyWillNotBuy可能不会买Rarely很少NeitherBadNorGood不好也不差Neutral中立NeitherDissat.NorSatisfied既不不满意也不满意MightorMightNotBuy可能会也可能不会买Sometimes有时Good好Important重要Satisfied满意ProbablyWillBuy可能会买Often经常VeryGood很好VeryImportant很重要Ve
34、rySatisfied很满意DefinitelyWillBuy绝对会买VeryOften很经常DevelopmentofaMulti-itemScale多项量表的开发2011/2/17ZHAODongyang Panzhihua University25DevelopmentofaMulti-itemScale多项量表的开发2011/2/17ZHAODongyang Panzhihua University26ScaleEvaluation量表的评价ScaleEvaluation量表评价Reliability信度Test/Retest重复测试信度AlternativeForms复本信度Inte
35、rnalConsistency内部一致性信度Validity效度Content内容效度Criterion准则效度Construct结构效度Convergent收敛效度Discriminant判别效度Nomological法则效度Generalizability推论性Fig.9.52011/2/17ZHAODongyang Panzhihua University27MeasurementAccuracy测量的准确性是反映一个物体某种特征的数字。测量值并不是我们感兴趣的特征的真实值,而是对他的一次观察。测量值许多因素可以引起测量误差,测量值或观察值与真实值偏离。测量误差(measuremente
36、rror)以一种不变的方式影响测量值,代表了每次进行测量时已同意方式影响观察得分的稳定因素。系统误差(systematicerror)每次测量时以不同的方式影响观察得分的暂时因素,比如瞬时的人员和场所因素。随机误差(randomerror)2011/2/17ZHAODongyang Panzhihua University28MeasurementAccuracy测量的准确性Thetruescoremodelprovidesaframeworkforunderstandingtheaccuracyofmeasurement.XO=XT+XS+XRwhereXO=theobservedscore
37、ormeasurementXT=thetruescoreofthecharacteristicXS=systematicerrorXR=randomerror真实得分模型为理解的测量准确性提供了一个框架。XO=XT+XS+XRXO=观察到的分数或测量值XT=特征的真实值XS=系统误差XR=随机误差2011/2/17ZHAODongyangPanzhihuaUniversity29PotentialSourcesofErroronMeasurement测量的误差可能来源Fig.9.61.Otherrelativelystablecharacteristicsoftheindividualthat
38、influencethetestscore,suchasintelligence,socialdesirability,andeducation.2.Short-termortransientpersonalfactors,suchashealth,emotions,andfatigue.3.Situationalfactors,suchasthepresenceofotherpeople,noise,anddistractions.4.Samplingofitemsincludedinthescale:addition,deletion,orchangesinthescaleitems.5.
39、Lackofclarityofthescale,includingtheinstructionsortheitemsthemselves.6.Mechanicalfactors,suchaspoorprinting,overcrowdingitemsinthequestionnaire,andpoordesign.7.Administrationofthescale,suchasdifferencesamonginterviewers.8.Analysisfactors,suchasdifferencesinscoringandstatisticalanalysis.1.影响测试分值的其他相对
40、稳定的个人特性,比如智力、社会愿望和教育等。2.短期或临时人员因素,如健康、情感和疲劳。3.情境因素如其他人的存在、噪声和分心的事物。4.量表中所列项目的取样:量表项目的添加、删除或更改。5.量表的说明或项目本身不够清楚。6.机械因素,如质量差印刷、问卷中的项目国与拥挤以及拙劣的设计。7.量表的执行,如访问员之间的差异。8.分析因素,如计分和统计分析中的差异。2011/2/17ZHAODongyangPanzhihuaUniversity30Reliability信度canbedefinedastheextenttowhichmeasuresarefreefromrandomerror,XR.
41、IfXR=0,themeasureisperfectlyreliable.Reliabilityrespondentsareadministeredidenticalsetsofscaleitemsattwodifferenttimesandthedegreeofsimilaritybetweenthetwomeasurementsisdetermined.Intest-retestreliabilitytwoequivalentformsofthescaleareconstructedandthesamerespondentsaremeasuredattwodifferenttimes,wi
42、thadifferentformbeingusedeachtime.Inalternative-formsreliability可以定义为测量中免除随机误差XR的程度。如果XR=0,那么测量是完全可行的。信度调查对象在尽可能相同的条件下,在两次不同的时间(间隔2-4周),执行完全相同量表项目,通过计算两个测量之间的相关系数确定两次测量之间的相似程度,相关系数越高,信度越高。重复测试信度构建两个等价的量表形式,在两个不同的时间测量相同的调查对象。复本信度2011/2/17ZHAODongyangPanzhihuaUniversity31Reliability信度determinestheexte
43、nttowhichdifferentpartsofasummatedscaleareconsistentinwhattheyindicateaboutthecharacteristicbeingmeasured.Internalconsistencyreliabilitytheitemsonthescalearedividedintotwohalvesandtheresultinghalfscoresarecorrelated.Insplit-halfreliabilityistheaverageofallpossiblesplit-halfcoefficientsresultingfromd
44、ifferentwaysofsplittingthescaleitems.Thiscoefficientvariesfrom0to1,andavalueof0.6orlessgenerallyindicatesunsatisfactoryinternalconsistencyreliability.Thecoefficientalpha,orCronbachsalpha用来评价一个求和量表的信度,量表中的几个项目被累加起来构建一个总分值。每个项目测量的是整个量表测量的构念的某个方面。内部一致性信度量表中的项目被分为两半,对两半的分值进行相关分析。两部分之间的高度相关表面高的内部一致性。分半信度
45、是来自分割量表项目的不同方法的所有可能的分半系数的平均数。这个系数在01之间。一个等于或小于0.6的值通常代表令人不满意的内部一致性。该系数有随量表项目数的增加而增加。系数或Cronbach2011/2/17ZHAODongyangPanzhihuaUniversity32Validity效度maybedefinedastheextenttowhichdifferencesinobservedscalescoresreflecttruedifferencesamongobjectsonthecharacteristicbeingmeasured,ratherthansystematicorra
46、ndomerror.Perfectvalidityrequiresthattherebenomeasurementerror(XO=XT,XR=0,XS=0).Thevalidityofascaleisasubjectivebutsystematicevaluationofhowwellthecontentofascalerepresentsthemeasurementtaskathand.Content validityreflectswhetherascaleperformsasexpectedinrelationtoothervariablesselected(criterionvari
47、ables)asmeaningfulcriteria.Criterion validity定义为观察值之间的差异所反映的物体之间被测特性的真是差异的程度,而不是系统误差或随机误差。完美的效度要求没有测量误差error(XO=XT,XR=0,XS=0)。量表的效度表面效度,对量表的内容表现特定测量任务的优劣程度的一个主观而系统的评价。内容效度指一个量表是否像预期的那样反应与选做标准的其他变量(标准变量)之间的关系。标准效度2011/2/17ZHAODongyangPanzhihuaUniversity33Validity效度addressesthequestionofwhatconstructo
48、rcharacteristicthescaleis,infact,measuring.Constructvalidityincludesconvergent,discriminant,andnomologicalvalidity.Constructvalidityistheextenttowhichthescalecorrelatespositivelywithothermeasuresofthesameconstruct.Convergentvalidityistheextenttowhichameasuredoesnotcorrelatewithotherconstructsfromwhi
49、chitissupposedtodiffer.Discriminantvalidityistheextenttowhichthescalecorrelatesintheoreticallypredictedwayswithmeasuresofdifferentbutrelatedconstructs.Nomologicalvalidity致力于解决量表实际测量的是那些构念或特性的问题。建构效度包括收敛效度、判别效度和法则效度。建构效度指的是量表与同一构念的其他指标确实相互关联的程度。收敛效度指的是一个测量值与其他应该有所不同的构念之间不相互关联的程度,涉及证明不同构念之间缺乏相互关联性。判别效
50、度指的是量表以在理论上可以预测的方式,与不同但相关的构念的测量值之间相互关联的程度。法则效度2011/2/17ZHAODongyangPanzhihuaUniversity34实例发现真实的自我与其他的测量自我概念的量表和朋友的分类高度相关(收敛效度)与无关的构念品牌忠诚和需求花样之间的相关度低(判别效度)与理论假设的那样,偏好与个人自我概念一直的品牌(法则效度)信度高以下发现提供了自我概念的多项量表的建构效度的证据:注意:此例将高信度包括在建构效度的证据中,这说明了信度与效度之间的关系。2011/2/17ZHAODongyangPanzhihuaUniversity35Relationshi