《第十一章多维标度法介绍.ppt》由会员分享,可在线阅读,更多相关《第十一章多维标度法介绍.ppt(66页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第十一章第十一章 多维标度法多维标度法(Multidimensional Scaling)第一节第一节 引引 言言第一节第一节 引引 言言多维标度法(MDS)是著名计量心理学家谢泼德(Shephard)和克鲁斯克 (Kruskal)分别于1962年和1964年发展起来的一种计量心理学技术。多维标度法现在已经广泛应用于心理学、市场调查、社会学、物理学、政治科学以及生物学等领域的数据分析方法。第一节第一节 引引 言言多维标度法是基于研究对象之间的相似性,将研究对象在一个低维的(一般小于等于二维)的空间形象地表示出来,进行聚类或维度内含分析的一种图示法。说得详细一点,MDS是这样一种方法:在N个物品
2、中已知它们的相似度(或距离),要寻找一个低维空间表示,使物品间的亲近(proximity)关系能和原来的相似度有一个近似的匹配。这个匹配的数量近似,可以用一个称为克鲁斯克系数“Stress的指标来表达。第一节第一节 引引 言言第一节第一节 引引 言言1970-1972年格林(Green)将多维标度法应用于市场研究方面,主要研究消费者的态度,衡量消费者的感觉和偏好。运用多维标度法将消费者对各种品牌产品的偏好和感觉资料,变换成空间坐标图。用坐标图中的点代表各种品牌;各点之间的距离则表示各种品牌在消费者心目中的相似或差异程度;各点到坐标的距离则表示消费者对某一品牌、某种特性的评价。这种方法将消费者对
3、各种品牌之间的相似或差异程度的评价,用距离及图形表示出来,因此具有形象直观的特点这里的输入资料是消费者对各种品牌产品之间的相似或差异程度的评价,其输出则是与品牌有关的特性以及各种品牌在各特性中的位置。因此,多维标度法是用间接方法推断出品牌有关的特性。在许多情形中,我们可能不知道那些特性与品牌有关,或者应答者不能够或不愿意准确地回答,这时必须采用间接推断的方法。广义的MDS可以将聚类分析和对应分析(Correspondence Analysis)也包括进来。根据它所利用的信息来看,多维标度法可以分为两大类:一类称为非度量的MDS(nonmetric MDS);另一类为量度的MDS(metric
4、MDS)。前者使用了研究对象间距离(或相似度)的排序信息,而后者用的是实际上的数量指标。第二节第二节 多维标度法的原理和计算步骤多维标度法的原理和计算步骤 在聚类分析中,对于给定坐标的一组点群,我们很容易计算它们两两之间的距离 或相似系数(如同火车站的里程表或运价表)。多维标度法可以说是上述问题的逆问题,即给定样品两两之间的距离或相似度的排序,反求各样品点的坐标。下面通过一个具体例子说明多维标度法的原理和计算步骤。例1 设一群消费者对A,B,C三种品牌的药物牙膏的相似程度的评定次序列于下表中,其中1表示两种品牌最相似,3表示两种品牌最不相似(差异最大)。从表中可知,A牌和B牌牙膏最相似,C牌和
5、B牌的相似次之,A牌和C牌相似性最差。我们将表1称为三种牙膏的相似次序矩阵。各种品牌的相似次序矩阵是多维标度法的输入资料。在第四节中我们将介绍几种建立相似次序矩阵的方法。A牌 B牌B牌C牌 13 2多维标度法的基本思想:多维标度法的基本思想:用r维空间(r待定)中的点分别表示各样品,使得各样品间距离的次序能完全反映原始输入的相似次序(两样品间的距离越短,则越相似)。通常,要通过两步来完成。首先构造一个r维坐标空间,并用该空间中的点分别表示各样品,此时点间的距离未必和原始输入次序相同,通常把这一步称为构造初步图形结构。其次是逐步修改初步图形结构,以得到一个新图形结构,使得在新结构中,各样品的点间
6、距离次序和原始输入次序尽量一致。下面我们将通过例1来具体说明其构造步骤。1构造初步图形结构例1中,我们构造一个二维坐标空间,A,B,C三种牙膏在该坐标空间中分别用A,B,C点表示(见图1),其坐标列于表2中。牙膏品牌x坐标y坐标A牌 B牌 C牌10 1 105517151055 10 15构造初步图形结构中的构造初步图形结构中的第一个问题是选择多少维坐标空间的点来表示各品牌产品,这个问题我们将在第三节中详细讨论。第二个问题是如何确定不同品牌的产品在坐标空间中的坐标。原则上我们可以随机地用任意不同点代表不同品牌,但这样做会大大增加逐步修改初步图形结构的工作量。一种可行的方法是将表1进行因子分析,
7、选择和坐标维数相同的公共因子数,将各品牌的因子载荷值分别作为它的坐标。我们用这种方法对例1确定出不同品牌的产品在所选坐标空间中的坐标。由于该初步图形结构的点间距离已和原始输入次序相同,因此不用再修改初步图形结构。为了说明修改初步图形结构的步骤和方法,表1中我们用航海三角测量技术来给出初步图形结构。2计算初步图形结构中各点之间的距离计算初步图形结构中各点之间的距离为叙述方便,有时我们将A,B,C三种品牌分别称为第一、第二、第三品牌。用欧氏距离公式计算A品牌和B品牌(第一品牌和第二品牌)的距离同样计算d13,d23,并将它们排成矩阵形式(dii=dii),这个矩阵称为初步图形结构的距离矩阵,如表3
8、所示。表3品牌 A B CABC 0 9 12 9 0 1512 15 03 3检验初步图形结构是否需要修改检验初步图形结构是否需要修改如果初步图形结构的距离矩阵所确定的相似次序(距离越小越相似)与原始相似次序矩阵的次序完全一致,则认为初步图形结构在所选定维数(本例是二维)空间中是最有代表性的。但一般来说,两者次序是很难一致的,这时要通过“克鲁斯克”系数来检验初步图形是否需要修改。用dij表示初步图形结构中i品牌和j品牌间的距离,如果用所有dij确定的相似次序和原始相似次序矩阵的次序不一致,就要将dij进行逐步调整,使得调整后i品牌和j品牌间的距离ij确定的相似次序和原始次序完全一致,调整过程
9、参见表4。下面我们来介绍克鲁斯克系数的含义。表4的第一,二列由表1得出。第三列为初步图形结构中和第二列对应的品牌间的距离。第四列中列出了dij调整为ij的过程。表中第三列的第二个距离大于第一个距离,与原始次序一致,可不必调整。但第三列的第三个距离则比较第二个距离小,与原始次序不一致,故需作调整。调整的方法是将它们求平均,得13.5。这个平均值大于第一个距离值9,故可用它作为新的第二、三个距离。得到第三次调整值ij,如表中第6列所示。这时,调整值的次序913.513.5与原始次序已完全一致,无须再作调整了。而若仍不一致,则应继续调整,直至调整后的ij的次序与原始次序完全一致为止。克鲁斯克系数定义
10、如下:克鲁斯克系数定义如下:其中n为品牌数,dij为初步图形结构中i品牌与j品牌间的距离,ij为调整后i品牌与j品牌间的距离。若一图形结构有这时克鲁斯克系数的分子为0,S=0,表示该图形结构十分理想,不需要再修改。用克鲁斯克系数检验某一图形结构是否与原始资料次序配合良好,可用表5。对于例1,利用表4可以算出克鲁斯克系数S如下:如选用S=0.025作为判别图形结构是否需要修改的临界值,现因S=0.1,故需要对初步图形结构进行修改。4修改初始图形结构,得出一个新图形结构修改初始图形结构,得出一个新图形结构若S大于事前所规定的临界值,则要移动初始图形结构中各点的位置,使得点际间之距离次序较前一图形结
11、构的距离次序更接近初始输入资料的次序。用(x,y)表示品牌i的旧坐标,(xi,yi)表示品牌i的新坐标,它们的关系如下:其中a(0aj的情形)。例如A,B,C,D,E五种品牌分成两组,某应答者的意见是A,B,D为一组,C和E为一组,则品牌矩阵的形式为将所有应答者的品牌矩阵的对应元素相加起来,便可得到总合品牌频率矩阵。显然,该矩阵小元素的值越大,则它对应的一对品牌间的相似程度越大。这样便可得到品牌间的相似次序矩阵。2变动组数分组法这种方法基本上和固定组数分组法相同,惟一的不同是应答者将各种品牌分成的组数可以少于预先给定的组数k。第五节第五节 应用实例应用实例 从这个例子中可以看出,MDS的解并不
12、惟一。例如将得到的解平移一下,旋转一下,甚至对称地旋转,将解以某个点为中心恰当地进行变换,都可以获得相同的Stress,得到类似的解。记住这一点是十分重要的。注注 给出初始图形结构的方法通常有两种:一是用上述航海三角测量技术的几何画法,另一是利用因子分析方法,如例1之1中所述。例3 多维标度法的一个经典的例子是根据给出的12个英国城市之间的公路的距离,重现这12个城市的地理位置(表9)。由于公路的弯弯曲曲,表中的距离并非是12个城市间的真正的“几何”距离。多维标图法就是没法在一个两维的平面上给出12个“构造点”,使这些构造点之间的距离能够尽可能地接近表中相应城市间的“距离”。这里城市代号为 人有了知识,就会具备各种分析能力,明辨是非的能力。所以我们要勤恳读书,广泛阅读,古人说“书中自有黄金屋。”通过阅读科技书籍,我们能丰富知识,培养逻辑思维能力;通过阅读文学作品,我们能提高文学鉴赏水平,培养文学情趣;通过阅读报刊,我们能增长见识,扩大自己的知识面。有许多书籍还能培养我们的道德情操,给我们巨大的精神力量,鼓舞我们前进。