《工程科技对应分析讲课讲稿.ppt》由会员分享,可在线阅读,更多相关《工程科技对应分析讲课讲稿.ppt(49页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、工程科技对应分析问题的提出问题的提出n如何更加有效地探索数据?-多元统计分析n我们已经掌握的高级统计分析方法n多元回归分析(Multiple linear regression/logistic regression)n主成分分析(Principal Component Analysis)n因子分析(Factor Analysis)n聚类分析(Cluster Analysis)n对数线性模型(log-linear Model)n方差分析(ANOVA Analysis)n判别分析(Discriminant Analysis)n典型相关分析(Canonical correlation analys
2、is)n结构方程式模型(Structural Equation Modeling)n定量数据的处理方法定性数据的处理?n多变量数据的图示化技术n对维尺度偏好分析(Multidimensional Preference Analysis)n多维尺度分析(Multidimensional Scaling MDS)n对应分析(Correspondence Analysis)2022/11/30v 一种新的多元统计分析技术。v 一种主要分析定性数据(Category Data)方法。v 一种强有力的数据图示化技术。v 一种定性数据定量化分析的技术。v 一种强有力的市场研究分析技术。对应分析对应分析本课
3、的目标本课的目标n了解对应分析的基本概念n了解对应分析方法如何帮助探索数据的n分析列联表和卡方的独立性检验n解释对应图n对应分析对数据的格式要求n学会如何使用SPSS作对应分析2022/11/30对应分析的基本概念对应分析的基本概念n对应分析是一种数据分析技术,它能够帮助我们研究由定性变量构成的交互汇总表来揭示变量间的联系。n交互表的信息以图形的方式展示。n是强有力的探索数据技术,主要适用于有多个类别的定类变量。n可以揭示同一个变量的各个类别之间的差异,以及不同变量各个类别之间的对应关系。n适用于两个或多个定类变量。2022/11/30对应分析的商业应用对应分析的商业应用n概念发展(Conce
4、ptDevelopment)n新产品开发(NewProductDevelopment)n市场细分(MarketSegmentation)n竞争分析(CompetitiveAnalysis)n广告研究(AdvertisementResearch)应用领域:2022/11/30对应分析可以回答以下问题对应分析可以回答以下问题 谁是我的用户?还有谁是我的用户?谁是我竞争对手的用户?相对于我的竞争对手的产品,我的产品的定位如何?与竞争对手有何差异?我还应该开发哪些新产品?对于我的新产品,我应该将目标指向哪些消费者?2022/11/30实用软件实用软件SPSSCategories模块模块SASMarke
5、ting模块模块变量的基本概念变量的基本概念测量等级测量等级1.名称级-定类变量2.顺序级-定序变量3.间隔级-定距变量4.比例级-定比变量低高转转换换定性定量非数量型数量型离散型随机变量连续型随机变量统计分析方法的应用有时候按变量的测量等级来划分。统计分析方法的应用有时候按变量的测量等级来划分。2022/11/30在社会调查和市场调查中,面临着大量的定性数据(定类变量)。在社会调查和市场调查中,面临着大量的定性数据(定类变量)。识别消费者群体的变量:年龄 收入 婚姻/家庭状况 性别 教育程度 职业 区分你的产品和竞争对手的产品变量:品牌 大小 颜色 产地 评价传统的分析方法传统的分析方法交互
6、(列联表)分析交互(列联表)分析n在市场研究中,对于定类变量的分析,最常用、最简单的方法是交互分析。n下面的列联表显示了三个地区的120名随机样本对四种牙膏品牌的使用情况:地区1地区2地区3合计品牌A553040品牌B525535品牌C155525品牌D155020合计404040120从直观来看,品牌A在地区3占统治地位;品牌B在地区2占统治地位;地区1的消费者比较偏好品牌C和D;品牌D在地区3没有支持者。2022/11/30对应分析的结果对应分析的结果案例:检验不同收入的消费者对品牌的选择案例:检验不同收入的消费者对品牌的选择BRANDLOWERMIDDLEUPPERTOTALA27162
7、5B497359C452332D449558E152522F171422TOTAL7577662181.低收入消费者与品牌B和E2.中等收入消费者与品牌D3.高收入消费者与品牌A、C和FSASMarket模块模块对应分析的基本原理对应分析的基本原理列联表(contingencytable)表中的每一行或每一列分别对应于一个行向量(点)或列向量(点);分别将行和列的概率(百分比)看成是空间行点和列点的分量,称这些点为行轮廓和列轮廓。列联表(交互表)是最常见的对应表的一种形式,通过交互分析得到行、列百分比,对于仅含有少量类的变量,通过这样的简单统计,就可以看出行、列变量之间的一些关系。2022/1
8、1/30行轮廓列轮廓q主成分(Principalcomponents)通过主成分分析,在以两个主成分为坐标轴的空间中,表出行轮廓或列轮廓,或同时标出行、列轮廓,从而探索它们之间的关系。这种近似地表示行列轮廓的图形叫对应图(correspondenceplot)。n惯量惯量(inertias)和特征值和特征值(eigenvalues)n惯量是度量行轮廓和列轮廓的变差的统计量,总惯量表示轮廓点的全部变差;n作图用的前两维度分别对应两个主惯量(principal inertias),表示在坐标轴方向上的变差;n主惯量就是对行轮廓和列轮廓作主成分分析时得到的特征值,特征值的平方根叫做奇异值(singu
9、lar values)。2022/11/30 卡方(Chi-square)和列联系数(contingency coefficient)是检验对应分析显著性或近似效果的统计量 数据的格式要求 对应分析数据的典型格式是列联表或交叉频数表。常表示不同背景的消费者对若干产品或产品的属性的选择频率。背景变量或属性变量可以并列使用或单独使用。两个变量间简单对应分析。多个变量间多元对应分析。对应图的维度(坐标轴)对应图的维度(坐标轴)分析的二维表中有r行、c列,即行变量有r类,列变量有c类,那么对应分析中所用的维度数目应为(r-1),(c-1)中的最小值,我们将其记作:min(r,c)-1。也就是说,我们可
10、以在min(r,c)-1维空间中非常好地描绘行变量的r类和列变量的c类。例如,某一列联表中有5行,4列,则维度的最大值是min(5,4)-1=3。但是从实用的角度来讲,我们可以在较低维度下,例如用二维空间来描绘行变量和列变量的类别,很显然,二维空间非常易于理解,而多维空间则不然。在通常情况下,两个维度就可以比较好地解释行变量与列变量。对应分析的主要步骤对应分析的主要步骤确定研究问题获得对应分析数据对列联表作对应分析作对应图并解释结果的意义评价分析的结果2022/11/30简单的对应分析简单的对应分析二维的列联表二维的列联表案例:一家音像连锁店,为了广告目的,需要了解不同类型的顾 客在选择借租节
11、目带类型的关系。性别性别gender年龄年龄age节目名称节目名称movies数量数量countF50MYSTERY 神话神话37F60DRAMA 戏曲戏曲702F35HORROR 恐怖恐怖44M35FAMILY 家庭家庭84M45ACTION 动作动作347F30ROMANCE 爱情爱情30F20SPORTS 体育体育24.F65COMEDY 喜剧喜剧86F20F25 M20M25DRAMAROMANCE2025 DRAMAROMANCE2025DRAMAROMANCE男Males女Females三个变量三个变量gender age movies同样的方法采用同样的方法采用spssn我们一起
12、来操作我们一起来操作多元对应分析多元对应分析案例:不同家庭背景的消费者对产地的汽车选择 SAS market 模块案例:不同年龄和性别人选择自杀的方法 SPSS correspondence analysis 模块对应分析的优点对应分析的优点1.定性变量划分的类别越多,这种方法的优势越明显。2.揭示行变量类别间与列变量类别间的联系。3.将类别联系直观地表现在二维图形中(对应图)。4.可以将名义变量或次序变量转变为间距变量。对应分析的局限对应分析的局限1.不能用于相关关系的假设检验。2.维度要由研究者决定。3.有时候对应图解释比较困难。4.对极端值比较敏感。一个实际应用案例一个实际应用案例新产品
13、名称的测试新产品名称的测试1.名字应该使消费者联想到正确的产品。2.名字应该使消费者有最接近正确产品的感觉。对新产品来说,产品名称是消费者认识和识别该产品的核心要素,是形成品牌概念的基础。为新产品起一个好的名字是非常重要的,好的名字至少应该满足下列两个条件:下面我将列出一些名词:下面我将列出一些名词:请您判断一下它们最象什么商品的名称?请您判断一下它们最象什么商品的名称?(出示卡片,只选一项)(出示卡片,只选一项)拟定中的新产品名称拟定中的新产品名称“波澜波澜”同其它同其它7个模拟的名称一起测试。个模拟的名称一起测试。问卷中的问题如下:问卷中的问题如下:1.清爽 2.甘甜 3.欢快 4.纯净
14、5.安闲 6.个性 7.兴奋 8.高档9.其它1.雪糕 2.纯水 3.碳酸饮料 4.果汁饮料 5.保健食品 6.空调7.洗衣机 8.毛毯 9.其它这些名称最能使您产生什么感觉?这些名称最能使您产生什么感觉?(出示卡片,只选一项)(出示卡片,只选一项)玉泉雪源春溪期望波澜天山绿中美纯雪浪花雪糕504422721145020258纯水50811027251838860579碳酸饮料5568933671473777果汁饮料1099514941361254365保健食品342945302371354218空调1128112146113392031洗衣机20125464365138210毛毯241736
15、29272935清爽3683221675357129149170甘甜237237142413495119116欢快19251851051234422193纯净142140128473812333068安闲1616106166811642136个性21497294413742兴奋4111078248351781高档3519107631266349168 的列联表名称X、产品联想Y和感觉Z的对应表-频数 对于一个168的列联表,用7-维空间才能完满地对其进行解释(100%),但是,可能有70%的对应表的惯量刚好保留在二维空间,从实用角度讲,用二维空间解释是可以接受的,也更易于理解。在品牌测试中,有
16、三个名义变量X,Y,Z,我们可以简单地将第三个变量Z附加在第二个变量Y上,构造一个新的二维表格,XYZ对应分析可以采用两种方法处理上面的表格:(1)在分析过程中,将变量Y和Z作为一个新的行变量(处置1);(2)对应分析只基于变量X和Y,而将变量Z作为附加行变量(处置2),这意味着变量Z的各类只是空间中的附加点,并不影响二维空间的属性,包括行、列得分,维度,坐标轴和方向。这里X=名称,Y=产品,Z=感觉,其中Y+Z=形象,作为一个新的变量。XYXZ两种情况都有8行和8列,如果数据是完全随机的没有显著的依赖关系,则从每个轴抽取的平均惯量应该能解释总惯量的100/(8-1)=14.3%,因此,任何贡
17、献大于14.3%的轴都被认为是重要的、不宜省略的,应该包括在解的空间中。(1)(2)xYZ(3_1)xYZ(3_2)第一种情况中的行、列变量类得分(可解释61.7%)第二种情况的行、列变量类得分(可解释77.7%)3-1行、列变量类得分(可解释63.5%,处置1)3-2的行、列变量类得分(可解释77.7%,处置2)表5:对应分析过程的最终汇总统计量1.572.328.594.5942.318.101.183.7773.267.071.129.9064.210.044.080.9865.077.006.011.9976.038.001.003.9997.018.000.001.1.000Total.5521.0001.000维度(Dimension)奇异值(SingularValue)惯量(Inertia)惯量比例(ProportionofInertia)比例累计比例卡方(ChiSquare)=3312.225概率值(Significancep)=.000谢谢!谢谢!大家有问题请联系:S 电话:010-65779296此课件下载可自行编辑修改,仅供参考!此课件下载可自行编辑修改,仅供参考!感谢您的支持,我们努力做得更好!谢谢感谢您的支持,我们努力做得更好!谢谢