《误差分析聚类分析之谱系聚类法幻灯片.ppt》由会员分享,可在线阅读,更多相关《误差分析聚类分析之谱系聚类法幻灯片.ppt(27页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、误差分析课件聚类分析之谱系聚类法第1页,共27页,编辑于2022年,星期二类间距离及其递推公式谱系聚类法的应用分析谱系聚类法的步骤谱系聚类第2页,共27页,编辑于2022年,星期二引言 谱系聚类法也称为系统聚类法,是目前应用较为广泛的一种聚类方法,它根据植物分类学的思想对研究对象进行分类。在植物分类学中,分类的单位是:门、纲、目、科、属、种,其中种是分类的基本单位。分类单位越小,它所包含的植物就越少,植物间的共同特征就越多。谱系聚类第3页,共27页,编辑于2022年,星期二 利用这种分类思想,谱系聚类法首先视各样品自成一类,然后把最相似的样品聚为小类,再将已聚合的小类按其相似性再聚合,随着相似
2、性的减弱,最后将一切子类都聚合成一个大类,从而得到一个按相近性大小聚结起来的谱系图,再进一步根据实际情况确定合适的分类个数。谱系聚类第4页,共27页,编辑于2022年,星期二问题判断两个样品最相似的依据是什么?谱系聚类第5页,共27页,编辑于2022年,星期二类间距离及其递推公式 常用的类间距离有四种:最短距离 最长距离 类平均距离 重心距离类间距离谱系聚类第6页,共27页,编辑于2022年,星期二 以 分别表示样品 ,以 简记 与 的距离 ,设 分别表示两个类,它们分别含有 个样品.我们用 来表示类 与 之间的距离.最短距离 即用两类中样品之间距离最短者作为两类间的距离.谱系聚类第7页,共2
3、7页,编辑于2022年,星期二最长距离 即用两类中样品之间距离最长者作为这两类间的距离.类平均距离 即用两类中所有两两样品之间的距离的平均作为两类之间的距离.或者 即用两类中所有两两样品之间的平方距离的平均作为两类间的平方距离.谱系聚类第8页,共27页,编辑于2022年,星期二重心距离设类 中的样品为 ,则其均值称为类 的重心.其中,分别是 的重心,即用两类的重心之间的距离作为两类间的距离.谱系聚类第9页,共27页,编辑于2022年,星期二 按照谱系聚类的思想,先将样品聚合成小类,再逐步聚为大类.设类 由类 合并所得,则 包含 个样品.为了更方便地实现谱系聚类,我们需要建立类间距离的递推公式,
4、即计算类 与其他类 之间的距离.类间距离的递推公式谱系聚类第10页,共27页,编辑于2022年,星期二常用的四种类间距离的递推公式最短距离最长距离谱系聚类第11页,共27页,编辑于2022年,星期二类平均距离对于类平均距离的下列定义方式 同理可得递推公式如下:谱系聚类第12页,共27页,编辑于2022年,星期二重心距离由 的合并集 的重心是 而 由,有 谱系聚类第13页,共27页,编辑于2022年,星期二 若采用欧氏距离的距离,以上介绍的4种类间距离的递推公式可统一表示为 计算样品之间 谱系聚类第14页,共27页,编辑于2022年,星期二各种类间距离的参数如下表所示谱系聚类第15页,共27页,
5、编辑于2022年,星期二谱系聚类法的步骤(1)n个样品开始时作为n个类,计算两两之间的距离,构成一个对称距离矩阵 此时,谱系聚类第16页,共27页,编辑于2022年,星期二 (2)选择 中主对角线以下(或以上)的最小距离,设这个元素是 ,这时 ,首先将 合并为一个新类 .在 中消去 ,所对应的行与列,并加入由新类 与剩下的其他未聚合的类间的距离所组成的一行和一列,得到一个更新的距离矩阵 ,它是 阶方阵.(3)从 出发重复步骤(2)的做法得 ,再由 出发重复上述步骤,直到 个样品聚为一个大类为止.(4)在合并过程中要记下合并样品的编号及两类合并时的距离(称为距离水平),并绘制聚类谱系图.谱系聚类
6、第17页,共27页,编辑于2022年,星期二谱系聚类法的应用分析 核电企业对自身库存的优化管理 仓库内存货位置摆放的合适与否会直接影响到总搬运费用、大修工作效率以及仓库人员的工作积极性。因此将备品备件正确地分类存放是非常重要的。应用谱系聚类法中的最短距离法对核电企业的备品备件进行分类,然后根据分类的结果对这些类之间的关系做总结归纳。谱系聚类第18页,共27页,编辑于2022年,星期二谱系聚类法的应用分析 将备品备件大致分为以下几类:机械类:紧固件、密封、轴承、过滤器、压缩机、管道、热交换器等;电气类:熔断器、断路器、变压器、电气元件、电机、电缆等;仪表类:电子元件、电路板、电源、工业计算机及备
7、件、各种测量仪等;五金类:金属材料等;其他类:焊接材料、润滑油、安全防护、消防器材等。谱系聚类第19页,共27页,编辑于2022年,星期二谱系聚类法的应用分析 为了便于说明,列举了部分变量指标,对这五类备品备件的各项变量打分如下表(满分10 分):谱系聚类第20页,共27页,编辑于2022年,星期二谱系聚类法的应用分析 然后利用欧式距离公式,根据表内的打分计算各类之间的相互距离,得到矩阵如下:谱系聚类第21页,共27页,编辑于2022年,星期二谱系聚类法的应用分析 由上述矩阵知,G4与G5之间距离最短,所以组成一个新类G6。然后再用G6 与其他类再次比较,即用G6 里面的子类G4 与G5 分别
8、与其他类的欧氏距离进行比较,选择其中距离小的为两类之间的距离。故得到新矩阵如下:谱系聚类第22页,共27页,编辑于2022年,星期二谱系聚类法的应用分析 此时,G3 与G6 之间的距离最短,所以G3、G4 和G5 共同组成一个新类G7,同上述步骤一样,得出新的矩阵如下:谱系聚类第23页,共27页,编辑于2022年,星期二谱系聚类法的应用分析 同理,G2 与G7 组成一个新类G8,G8 与G1 的欧氏距离为:综上所述,我们在距离为11 的水平上首先合并五金类和其他类,得到新类G6=G4,G5;然后,更新距离矩阵后又在距离为12 的水平上合并G3 与G6 得到新类G7=G3,G4,G5;在距离为1
9、3 的水平上合并G2 与G7 为新类G8;最后在距离为41 的水平上将G1 与G8 合并成一个大类。谱系聚类第24页,共27页,编辑于2022年,星期二谱系聚类法的应用分析 将上述聚类过程连同合并时的水平用图表示出来,可以画出谱系图如下:谱系聚类第25页,共27页,编辑于2022年,星期二谱系聚类法的应用分析 由此可见,这五类归纳为两类比较合适,即电气类、仪表类、五金类和其他类为一类,机械类自成一类。把聚类结果按照现实中的具体情况再加以调整,将相近的类存放在比较近的位置或者以相同的工作程序进行处理,以便于按照大修及日常维护工作的需要及时地准备好备品备件,为机组正常运行发电提供有效保障并且降低了搬运成本。谱系聚类第26页,共27页,编辑于2022年,星期二谢谢!谱系聚类第27页,共27页,编辑于2022年,星期二