对应分析.ppt

上传人:hyn****60 文档编号:70752443 上传时间:2023-01-27 格式:PPT 页数:21 大小:138.50KB
返回 下载 相关 举报
对应分析.ppt_第1页
第1页 / 共21页
对应分析.ppt_第2页
第2页 / 共21页
点击查看更多>>
资源描述

《对应分析.ppt》由会员分享,可在线阅读,更多相关《对应分析.ppt(21页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、第六章第六章 对应分析对应分析第一节第一节 对应分析概述对应分析概述第二节第二节 统计软件应用统计软件应用第一节第一节 对应分析概述对应分析概述对应分析概念对应分析概念多元对应分析多元对应分析基本思路基本思路优点优点局限性局限性假设条件假设条件对应分析的概念对应分析的概念在分析定类或定序变量时,往往采用非线性在分析定类或定序变量时,往往采用非线性统计方法(如统计方法(如Loglinear等),但在每个变量等),但在每个变量都划分成许多类别的情况下,这些分析方法都划分成许多类别的情况下,这些分析方法很难直观地揭示出变量之间的联系以及变量很难直观地揭示出变量之间的联系以及变量类别之间的关系。类别之

2、间的关系。对应分析(对应分析(Correspondence Analysis):):通过分析由定性变量构成的交互分类表来揭通过分析由定性变量构成的交互分类表来揭示变量间的联系,将定性变量数据转化为可示变量间的联系,将定性变量数据转化为可度量的分值、减少维度并作出分值分布图。度量的分值、减少维度并作出分值分布图。对应分析的概念对应分析的概念在减少维度方面,与因子分析类似;在减少维度方面,与因子分析类似;在做分布图方面,与多维标度方法相似。在做分布图方面,与多维标度方法相似。它是一种多元相依变量统计分析技术,与其他相依它是一种多元相依变量统计分析技术,与其他相依变量分析技术的不同在于:变量分析技术

3、的不同在于:l1)可分析定性变量;)可分析定性变量;l2)可分析非线性关系)可分析非线性关系;运用分布图分析变量类别间的关系的方法:运用分布图分析变量类别间的关系的方法:l分解法(分解法(Decomposi-tional Method),如多维标度。),如多维标度。l构成法(构成法(Compositional Method),如因子分析、判别),如因子分析、判别分析。分析。多元对应分析多元对应分析具体可以采取两种方法:具体可以采取两种方法:l合并法。对超过二元的变量进行转换,将两个或合并法。对超过二元的变量进行转换,将两个或多个变量合并为一个变量(如多个变量合并为一个变量(如“性别性别”和和“

4、城乡城乡”合并为合并为“性别城乡性别城乡”,城市男性、城市女性、,城市男性、城市女性、农村男性、农村女性四个变量值),从而使各个农村男性、农村女性四个变量值),从而使各个变量的所有类别都表现在同一个多维空间里。适变量的所有类别都表现在同一个多维空间里。适用于变量个数较少的情况。用于变量个数较少的情况。l同质分析(同质分析(Homogeneity Analysis)。对多个)。对多个定性变量进行主成分分析,其优势是可对多个定定性变量进行主成分分析,其优势是可对多个定性变量进行对应分析。性变量进行对应分析。对应分析的基本思路对应分析的基本思路基本思路:通过对二维交互表的条件次数分析来基本思路:通过

5、对二维交互表的条件次数分析来确定变量及其类别之间的关系。确定变量及其类别之间的关系。例如:例如:l在分析顾客对不同品牌商品的喜好时,可将商品品牌在分析顾客对不同品牌商品的喜好时,可将商品品牌与顾客的性别、收入水平、职业等进行交叉分类,表与顾客的性别、收入水平、职业等进行交叉分类,表中的每一项数字都代表着某一类顾客喜欢某一品牌的中的每一项数字都代表着某一类顾客喜欢某一品牌的人数,这一人数就是这类顾客与这一品牌的人数,这一人数就是这类顾客与这一品牌的“对应对应”点,代表不同特点的顾客与品牌之间的联系。点,代表不同特点的顾客与品牌之间的联系。l通过分析,可以把品牌、顾客特点以及他们之间的联通过分析,

6、可以把品牌、顾客特点以及他们之间的联系同时反映在一个二维或三维的分布图上,顾客认为系同时反映在一个二维或三维的分布图上,顾客认为比较相似的品牌在图上的分布便会彼此靠近在一起。比较相似的品牌在图上的分布便会彼此靠近在一起。l根据顾客特点与每一品牌之间距离的远近,还可以区根据顾客特点与每一品牌之间距离的远近,还可以区分顾客的哪些特点与喜好某种品牌的关系密切。分顾客的哪些特点与喜好某种品牌的关系密切。对应分析的基本思路对应分析的基本思路在对应分析中,每个变量的类别差异是通过在对应分析中,每个变量的类别差异是通过直观图上的分值距离表现出来的;直观图上的分值距离表现出来的;l这个距离是经过加权以这个距离

7、是经过加权以Chi-square值(其分布值(其分布是由累计交互分类表中每一交互组的实际频数与是由累计交互分类表中每一交互组的实际频数与期望频数的差值得来的)的差异表现出来的距离,期望频数的差值得来的)的差异表现出来的距离,即将即将Chi-square值转变成可度量的距离。值转变成可度量的距离。操作前提:操作前提:l对于分析的基础是交互分类表,表中每个条件次对于分析的基础是交互分类表,表中每个条件次数都不能是数都不能是0或负数;或负数;l如果有为如果有为0的条件次数出现应当对变量的分类进的条件次数出现应当对变量的分类进行合并,去掉这个类别。行合并,去掉这个类别。对应分析的优点对应分析的优点定性

8、变量划分的类别越多,这种方法的有时定性变量划分的类别越多,这种方法的有时越明显;越明显;揭示行变量类别间与列变量类别间的联系;揭示行变量类别间与列变量类别间的联系;将类别联系直观地表现在图形中;将类别联系直观地表现在图形中;将定类或定序变量转变为定距变量。将定类或定序变量转变为定距变量。对应分析的局限性对应分析的局限性不能用于相关关系的假设检验。不能用于相关关系的假设检验。l它只是一种描述性的条件方法,只能揭示变量它只是一种描述性的条件方法,只能揭示变量间的联系;间的联系;维度要由研究者决定。维度要由研究者决定。l在分析过程中,研究者可以知道最大维度数是在分析过程中,研究者可以知道最大维度数是

9、多少;多少;l但是,减少到几维为好必须衡量分析结果是否但是,减少到几维为好必须衡量分析结果是否可解释以及是否简约。可解释以及是否简约。对极端值敏感。对极端值敏感。对应分析的假设条件对应分析的假设条件对数据类型、变量间的关系无严格限定。要求:对数据类型、变量间的关系无严格限定。要求:l调查对象必须有代表性,调查对象必须有代表性,l研究对象要有可比性;研究对象要有可比性;l变量的类别应当涵盖所有可能出现的情况。变量的类别应当涵盖所有可能出现的情况。对于所分析的调查数据,还有以下假设条件:对于所分析的调查数据,还有以下假设条件:l被调查者回答问题时并不都从同一角度(或称维度)作被调查者回答问题时并不

10、都从同一角度(或称维度)作出判断。出判断。l在意愿、态度等调查中,被调查者通常会从两个维度进行评判,在意愿、态度等调查中,被调查者通常会从两个维度进行评判,即主观维度和客观维度。即主观维度和客观维度。l换言之,被调查者并不都是用同样的主观或客观维度及指标来作换言之,被调查者并不都是用同样的主观或客观维度及指标来作为判断的依据。为判断的依据。l所有被调查者对于某一维度重要性的评价不必一样。所有被调查者对于某一维度重要性的评价不必一样。l被调查者的评判角度和看法可以改变。被调查者的评判角度和看法可以改变。第二节第二节 统计软件应用统计软件应用分析结果指标的含义分析结果指标的含义;提供的统计量和图形

11、及其含义;提供的统计量和图形及其含义;SPSS操作步骤;操作步骤;STATA命令及结果命令及结果分析结果指标的含义分析结果指标的含义Scores:l分值,表示在相应维度上的坐标;分值,表示在相应维度上的坐标;Single Value:l奇异值,即特征值的平方根。代表行与列分值的相关奇异值,即特征值的平方根。代表行与列分值的相关关系,相当于相关分析里的相关系数关系,相当于相关分析里的相关系数r;Inertia:l惯量,即特征值(惯量,即特征值(Eigenvalue),表示每个维度对),表示每个维度对变量各个类别之间差异的解释量;变量各个类别之间差异的解释量;Proportion Explaine

12、d:l解释比例,即每一维度的特征值与特征值总和相除得解释比例,即每一维度的特征值与特征值总和相除得到的比例,以便确定用几维来表现变量类别的差异。到的比例,以便确定用几维来表现变量类别的差异。Cumulative Proportion:l累计解释比例。累计解释比例。分析结果的含义分析结果的含义 row and column profiles:l交互分类表,为对应分析的基础数据;交互分类表,为对应分析的基础数据;row /column scores:l行、列变量在不同维度上的分值,即作图的坐标。行、列变量在不同维度上的分值,即作图的坐标。row/column score confidence st

13、atistics:l行、列变量在不同维度上分值的置信区间。行、列变量在不同维度上分值的置信区间。Contribution of row/column points to the inertia of each dimension:l行、列变量对各维度特征值的贡献,作用是检查行、列行、列变量对各维度特征值的贡献,作用是检查行、列变量各个类别对每一维度特征值的影响。变量各个类别对每一维度特征值的影响。Contribution of dimensions to the inertia of each row/column points:l各维度对行、列变量特征值的贡献,作用是检查每一维各维度对行、列

14、变量特征值的贡献,作用是检查每一维度对行、列变量各个类别特征的影响。度对行、列变量各个类别特征的影响。距离的测度方法及作图距离的测度方法及作图距离测度方法(距离测度方法(Distance Measure):):lChi square.加权卡方距离加权卡方距离lEuclidean.欧氏距离欧氏距离row/column point plots:l行、列变量各分类在不同维度上的分布图;行、列变量各分类在不同维度上的分布图;lbi-plots:行和列变量各分类在不同维度上的联合分布;:行和列变量各分类在不同维度上的联合分布;ltransformation plots:Produces a plot o

15、f the original row category values against their corresponding row(column)scores。图形的作用:图形的作用:l重新分类的依据;重新分类的依据;l判断不同类别差异的大小。判断不同类别差异的大小。距离测度的标准化方法距离测度的标准化方法Row and column means are removed.lBoth the rows and columns are centered.This method is required for standard correspondence analysis.Row means a

16、re removed.Column means are removed.Row/Column totals are equalized and means are removed.lBefore centering the rows/column,the row/column margins are equalized.根据分析重点绘图选项根据分析重点绘图选项Normalization Method.l决定绘图时是以行变量为主还是以列变量为主,或者是同时决定绘图时是以行变量为主还是以列变量为主,或者是同时考虑行列变量。具体方法:考虑行列变量。具体方法:lSymmetrical.关注行和列变量中

17、不同类别的差异或联系。关注行和列变量中不同类别的差异或联系。lPrincipal.同时关注行和列变量各类别间的差异。同时关注行和列变量各类别间的差异。lRow principal.分析的重点是行变量各类别间的差异。分析的重点是行变量各类别间的差异。lColumn principal.分析的重点是列变量各类别间的差异。分析的重点是列变量各类别间的差异。lCustom.常规设定的方法,利于作图。常规设定的方法,利于作图。lCanonical。典型标准化方法。该方法关注的是行、列两个。典型标准化方法。该方法关注的是行、列两个变量之间关系,而不是每个变量不同类别之间的差异。变量之间关系,而不是每个变量

18、不同类别之间的差异。SPSS中对应分析应用菜单:菜单:lSPSSAnalyzeData ReductionCorrespondence Analyze 相关程序:相关程序:l如果多于2个变量,则采用lmultiple correspondence analysis;l如果变量为定序尺度,则采用lcategorical principal components analysis。STATA中对应分析应用二元对应分析:二元对应分析:命令为 ca Syntaxl Simple correspondence analysis of two categorical variablesl ca rowva

19、r colvar,options,eg:l.ca rank smoking;l.ca rank smoking,dim(3)l Simple correspondence analysis with crossed(stacked)variablesl ca row_spec col_spec,options lwhere spec=varname|(newvarname:varlist)。eg:l.ca A(demo:sex edu),dim(2)report(c)length(min)STATA中对应分析应用二元对应分析之后的统计量和作图二元对应分析之后的统计量和作图command des

20、criptionlcabiplot biplot of row and column pointslcaprojection CA dimension projection plotlestat coordinates display row and column coordinateslestat distances display chi-squared distances between row and column profileslestat inertia display inertia contributions of the individual cellslestat loa

21、dings display correlations of profiles and axes(loadings)lestat profiles display row and column profilesl+estat summarize estimation sample summary(not available after camat.)lestat table display fitted correspondence tablelscreeplot plot singular valuesl+predict fitted values,row coordinates,or col

22、umnSTATA中对应分析应用Syntax for predict:lpredict type newvar if in,statistic statistic description fit fitted values;the defaultrowscore(#)row score for dimension#colscore(#)column score for dimension#STATA中对应分析应用多元对应分析。多元对应分析。命令为mca lmca varlist,options。eg:l.mca A B C D;l.mca A B C D,method(indicator)dim(3)compactl.mca A B C D,method(joint)supp(demo:sex edu)

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 生活常识

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁