《《对应分析》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《对应分析》PPT课件.ppt(9页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、 第章典型相关分析第章典型相关分析zfo现实中:现实中:如鸡蛋、猪肉的价格(作为第一组变量)和如鸡蛋、猪肉的价格(作为第一组变量)和相应产品的销量(第二组变量)有相关关系。如投资性相应产品的销量(第二组变量)有相关关系。如投资性变量(劳力投入、财力投入、固定资产投资等)与国民变量(劳力投入、财力投入、固定资产投资等)与国民收入(工农业收入、建筑业收入、等)具有相关关系。收入(工农业收入、建筑业收入、等)具有相关关系。o如何研究两组变量之间的相关关系?如何研究两组变量之间的相关关系?设两组变量用设两组变量用X X1 1,X,X2 2.,X.,XP P以及以及Y Y1 1,Y,Y2 2YYP P表
2、示。表示。(1 1)分别研究)分别研究X Xi i和和Y Yj j之间的相关关系,列出相关系数表。之间的相关关系,列出相关系数表。其缺陷:其缺陷:当两组变量较多时,处理较烦琐,不易抓住问当两组变量较多时,处理较烦琐,不易抓住问题的实质。(题的实质。(2 2)采用主成分分析的方法,每组变量分)采用主成分分析的方法,每组变量分别提取主成分,再通过主成分之间的关系反映两组变量别提取主成分,再通过主成分之间的关系反映两组变量之间的关系。之间的关系。zf例:鸡蛋、猪肉的价格用例:鸡蛋、猪肉的价格用X X1 1和和X X2 2表示;鸡蛋、猪肉的销量用表示;鸡蛋、猪肉的销量用Y Y1 1和和Y Y2 2表示
3、。表示。构造第一组和第二组变量的线性组合:构造第一组和第二组变量的线性组合:F F1 1=a=a1111X X1 1+a+a1212X X2 2 Z Z1 1=a=a1111Y Y1 1+a+a1212Y Y2 2 满足满足F F1 1和和Z Z1 1的相关的相关性最大化。性最大化。典型相关分析典型相关分析zfv、什么是典型相关分析?、什么是典型相关分析?v典型相关分析是研究两组变量之间相关关典型相关分析是研究两组变量之间相关关系的多元统计分析方法它系的多元统计分析方法它借用主成分分析降借用主成分分析降维的思想维的思想,分别对两组变量提取主成分,且使,分别对两组变量提取主成分,且使两组变量提取
4、的主成分之间的相关程度达到最两组变量提取的主成分之间的相关程度达到最大,而从同一组内部提取的各主成分之间互不大,而从同一组内部提取的各主成分之间互不相关,用从两组之间分别提取的主成分的相关相关,用从两组之间分别提取的主成分的相关性来描述两组变量整体的线性相关关系性来描述两组变量整体的线性相关关系zfo典型相关关系研究两组变量之间整体的线性相关关系,典型相关关系研究两组变量之间整体的线性相关关系,它是将每一组变量作为一个整体来进行研究而不是分析它是将每一组变量作为一个整体来进行研究而不是分析每一组变量内部的各个变量所研究的两组变量可以是每一组变量内部的各个变量所研究的两组变量可以是一组为自变量,
5、而另一组变量为因变量;两组变量也可一组为自变量,而另一组变量为因变量;两组变量也可以是同等的地位,但典型相关关系要求两组变量都至少以是同等的地位,但典型相关关系要求两组变量都至少是间隔尺度是间隔尺度zf 第第9 9章定性数据的建模分析章定性数据的建模分析zf 对定性变量间关系的描述可用交叉列联表。但交叉列对定性变量间关系的描述可用交叉列联表。但交叉列联表存在以下缺陷:联表存在以下缺陷:(1 1)不能充分分析多变量交互效应,不能有效分析)不能充分分析多变量交互效应,不能有效分析多变量之间的关联。多变量之间的关联。(2 2)在进行两个变量之间的关联分析时缺乏对其他)在进行两个变量之间的关联分析时缺
6、乏对其他变量影响的有效控制。变量影响的有效控制。(3 3)不能准确定量描述一个变量对另一个变量的作)不能准确定量描述一个变量对另一个变量的作用幅度。用幅度。如何避免以上缺陷,充分揭示出定性变量之间的复杂关系如何避免以上缺陷,充分揭示出定性变量之间的复杂关系?zf (1 1)对数线性模型)对数线性模型将概率取对数后分解处理:将概率取对数后分解处理:zf 其优点是可以把方差分析和线性模型方法相结合,其优点是可以把方差分析和线性模型方法相结合,估计模型中各个参数,而这些参数值使各个变量的效应估计模型中各个参数,而这些参数值使各个变量的效应和变量间的交互作用效应得以数量化。和变量间的交互作用效应得以数
7、量化。(2 2)Logistic Logistic 模型模型 是将概率比取对数后,再进行参数化而获得。设因是将概率比取对数后,再进行参数化而获得。设因变量变量y y为二值定性变量,用为二值定性变量,用0 0和和1 1表示两个不同状态,表示两个不同状态,y=1y=1的概率的概率p pP P(y=1)y=1)是研究对象。若有多个因素影响是研究对象。若有多个因素影响y y的取的取值,这些因素就是自变量,记为:值,这些因素就是自变量,记为:x1,x2xk(x1,x2xk(既可以是既可以是定性变量也可以是定量变量)。定性变量也可以是定量变量)。Logistic Logistic 线性回归模线性回归模型:型:zf