《对应分析PPT讲稿.ppt》由会员分享,可在线阅读,更多相关《对应分析PPT讲稿.ppt(41页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、对应分析第1页,共41页,编辑于2022年,星期六主要内容主要内容对应分析的统计思想对应分析的统计思想对应分析的方法原理对应分析的方法原理对应分析的计算程序对应分析的计算程序对应分析的案例讲解对应分析的案例讲解第2页,共41页,编辑于2022年,星期六对应分析(对应分析(Correspondence Analysis):通过分析由:通过分析由定性定性变量构成的交互汇总表来揭示变量间的联系。变量构成的交互汇总表来揭示变量间的联系。对应分析可以揭示同一变量的各个类别之间的差对应分析可以揭示同一变量的各个类别之间的差异,不同变量各个类别之间的对应关系。可以两异,不同变量各个类别之间的对应关系。可以两
2、个变量的联系做在一个图里表示出来。个变量的联系做在一个图里表示出来。对应分析由法国统计学家对应分析由法国统计学家Beozecri于于1970年提出年提出 第3页,共41页,编辑于2022年,星期六列联表列联表(contingency table):综合了两个变量:综合了两个变量的联合分布表,同时汇总两个变量的数据的方的联合分布表,同时汇总两个变量的数据的方法。又称交叉分组表(法。又称交叉分组表(crosstabulation)家庭状况家庭状况青少年行为青少年行为犯罪犯罪未犯罪未犯罪破裂破裂14645和好和好334499第4页,共41页,编辑于2022年,星期六生活自理能力完全自理部分自理不能自
3、理合计合计自评健康状况很好129148151好931146961173一般66011674850差25110481436很差1172341没回答15132452合计合计19974003062703例:北京老龄化研究数据例:北京老龄化研究数据第5页,共41页,编辑于2022年,星期六写成能对应分析数的据写成能对应分析数的据第6页,共41页,编辑于2022年,星期六SPSS数据输入变量设置(做分析之前要加上权做分析之前要加上权重重data-wight case-选人数选人数)第7页,共41页,编辑于2022年,星期六对应分析对应分析 correspondence analysis第8页,共41页,
4、编辑于2022年,星期六选择行变量,定义其取值范围选择行变量,定义其取值范围16,再,再update第9页,共41页,编辑于2022年,星期六第10页,共41页,编辑于2022年,星期六维度奇异值惯量卡方P值 惯量比例奇异值是惯量(特征值)的平方根。惯量用于说明奇异值是惯量(特征值)的平方根。惯量用于说明对应分析各个维度的结果能够解释列联表中两个变对应分析各个维度的结果能够解释列联表中两个变量联系的程度。第一维度可解释总信息的量联系的程度。第一维度可解释总信息的92.5%第11页,共41页,编辑于2022年,星期六各类的各类的比例比例维度的分维度的分值值第12页,共41页,编辑于2022年,星
5、期六第13页,共41页,编辑于2022年,星期六第14页,共41页,编辑于2022年,星期六GET FILE=E:SPSS数据数据 应分析应分析.sav.DATASET NAME DataSet1 WINDOW=FRONT.WEIGHT BY renshu.CORRESPONDENCE TABLE=ziping(1 6)BY zili(1 3)/DIMENSIONS=2 /MEASURE=CHISQ /STANDARDIZE=RCMEAN /NORMALIZATION=SYMMETRICAL /PRINT=TABLE RPOINTS CPOINTS /PLOT=NDIM(1,MAX)BIPLO
6、T(20).第15页,共41页,编辑于2022年,星期六 对应分析是将对应分析是将R型因子分析与型因子分析与Q型因子分析结型因子分析结合起来进行统计分析的统计方法。合起来进行统计分析的统计方法。对变量进行因子分析称对变量进行因子分析称R型因子分析,对样本进型因子分析,对样本进行因子分析称行因子分析称Q型因子分析型因子分析 对应分析从对应分析从R型因子分析出发,而直接获得型因子分析出发,而直接获得Q型型因子的分析结果。因子的分析结果。根据根据R型和型和Q型分析的内在联系,将变量和指标型分析的内在联系,将变量和指标同时反映到相同坐标轴的一张图形上,便同时反映到相同坐标轴的一张图形上,便 于对问题于
7、对问题分析。分析。第16页,共41页,编辑于2022年,星期六对应分析提供三个方面的信息:对应分析提供三个方面的信息:指标之间的信息指标之间的信息样本之间的信息样本之间的信息指标与样本之间的信息指标与样本之间的信息这些关系是通过作图来表示的。这些关系是通过作图来表示的。第17页,共41页,编辑于2022年,星期六样本数据样本数据第18页,共41页,编辑于2022年,星期六第19页,共41页,编辑于2022年,星期六概率矩阵概率矩阵第20页,共41页,编辑于2022年,星期六第21页,共41页,编辑于2022年,星期六 i=1,2,n称为称为n个个p维空间中样本点维空间中样本点研究两个样本点研究
8、两个样本点K,L之间的欧氏距离。之间的欧氏距离。第22页,共41页,编辑于2022年,星期六加权距离,可以消除数量级的影响加权距离,可以消除数量级的影响,第23页,共41页,编辑于2022年,星期六 可以理解成可以理解成n个样本点第个样本点第 i个样本的座标变为个样本的座标变为 i=1,2,n两个样本点两个样本点K,L的距离为的距离为第24页,共41页,编辑于2022年,星期六同理同理从列的方向看从列的方向看,可以将样本矩阵中的列看成是可以将样本矩阵中的列看成是 n维空间中的点,变量维空间中的点,变量Xi列为列为第25页,共41页,编辑于2022年,星期六设两个变量设两个变量Xi与与Xj的距离
9、为的距离为加权距离,可以消除数量级的影响加权距离,可以消除数量级的影响,第26页,共41页,编辑于2022年,星期六 矩阵变为矩阵变为求各列的加权平均值求各列的加权平均值第27页,共41页,编辑于2022年,星期六这是按概率加权平均这是按概率加权平均因为因为变量变量均值均值,由于由于第28页,共41页,编辑于2022年,星期六因为因为 协方差公式为协方差公式为所以从矩阵所以从矩阵第29页,共41页,编辑于2022年,星期六两个变量两个变量Xi,Xj的协方差的协方差P个变量的协方差个变量的协方差第30页,共41页,编辑于2022年,星期六第31页,共41页,编辑于2022年,星期六第32页,共4
10、1页,编辑于2022年,星期六第33页,共41页,编辑于2022年,星期六类似对变量的方法类似对变量的方法,对样本点好可得协方差矩阵对样本点好可得协方差矩阵A与与B通过通过Z矩阵联系起来了矩阵联系起来了,存在对应关系存在对应关系A与与B的非零特征根相同的非零特征根相同第34页,共41页,编辑于2022年,星期六因为有因为有两边右乘两边右乘Z有相同的特征根有相同的特征根第35页,共41页,编辑于2022年,星期六对对A进行因子分析,求得因子载荷矩阵进行因子分析,求得因子载荷矩阵对前两个因子载荷作图。对前两个因子载荷作图。A=ZZ第36页,共41页,编辑于2022年,星期六B=ZZ对对B进行因子分
11、析,求得因子载荷矩阵进行因子分析,求得因子载荷矩阵对前两个因子载荷对前两个因子载荷 作图。作图。第37页,共41页,编辑于2022年,星期六将下列数据改写成可以对应分析的数据形式将下列数据改写成可以对应分析的数据形式第38页,共41页,编辑于2022年,星期六父母社会经济状况高低心理高1234低5受损Impaired8660947871轻微MildSymp1881051419771中等Moderate11265775454好Well12157723621第39页,共41页,编辑于2022年,星期六本户月收入自建住房购买商品房购买经济适用房购买原公有住房租凭公有住房租凭商品住房其他 1000以下166392713714558938949456 1000-2000698104914623548792927296 2001-3000143569716165214214861 3001-400041160247644444819 4001-6000238854320181816 6001-80001288293408000以上111004021第40页,共41页,编辑于2022年,星期六第41页,共41页,编辑于2022年,星期六