《聚类分析与判别分析课件.ppt》由会员分享,可在线阅读,更多相关《聚类分析与判别分析课件.ppt(28页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、聚类分析与判别分析第1页,此课件共28页哦7.1 K-均值聚类分析 聚类分析简介做什么?把没有分类信息的资料按照相似程度归类怎么做?系统聚类法和非系统聚类法第2页,此课件共28页哦K-均值聚类法基本原理 第3页,此课件共28页哦 K均值聚类法迭代终止条件两次迭代计算的聚心之间距离的最大改变量小于初始聚心间最小距离的 倍到达迭代次数的上限第4页,此课件共28页哦 K均值聚类的优缺点优点:优点:占有内存少、计算量小、处理速度快,特别适合大样 本的聚类分析 缺点:缺点:1、应用范围有限,要求用户指定分类数目;2、只能对观测量聚类,而不能对变量聚类;3、所使用的聚类变量必须都是连续性变量。第5页,此课
2、件共28页哦利用如下数据将以下城市按照空气指标分类第6页,此课件共28页哦 执行【Analyze】/【Classify】/【K-means Cluster】命令,弹出如图所示对话框第7页,此课件共28页哦结果解读结果解读初始聚类中心表第8页,此课件共28页哦迭代史表6次终止迭代第9页,此课件共28页哦最终聚类中心表第10页,此课件共28页哦7.2 系统聚类法 系统聚类法的基本思想是:视观测量(或者变量)各自成为一类;找性质最接近的两个类合并成一个新类,计算在新的类别分划下各类之间的距离;再将性质最接近的两类合并,直到所有模式聚成一类为止。第11页,此课件共28页哦 系统聚类法优点:既可以对观测
3、量也可以对变量进行聚类;所使用的变量既可以是连续变量也可以是分类变量;提供的距离计算方法和结果显示方法也很丰富。第12页,此课件共28页哦观测量聚类:按照交通情况对各地进行聚类第13页,此课件共28页哦 执行【Analyze】/【Classify】/【Hierarchical Cluster】命令,弹出如图所示的对话框 第14页,此课件共28页哦结果解读聚类进度表第15页,此课件共28页哦龙骨图第16页,此课件共28页哦变量聚类:按照日照数对月份进行聚类 第17页,此课件共28页哦 结果解读结果解读聚类进度表垂直冰柱图从下往上看第18页,此课件共28页哦龙骨图第19页,此课件共28页哦7.3
4、判别分析DiscriminantDiscriminant过程 判别分析简介干什么?判别样品所属类型的一种统计方法与聚类分析的关系 相同点:解决分类问题 不同点:判别分析是在已知研究对象分成若干类型,对未 知类型的样品进行判别分类 第20页,此课件共28页哦判别分析的一般步骤第21页,此课件共28页哦 常用判别法距离判别法距离判别法:根据已知分类的数据,分别计算各类的均值(重心),判别准则是任给一次观测,若它与第i类的重心距离最近,就认为它来自第i类。注意:距离一般采用马氏距离;距离判别适合对自变量均为连续变量的情况进行分类;距离判别对各类的分布无特定的要求。第22页,此课件共28页哦Fishe
5、rFisher判别法判别法:借助方差分析的思想构造一个判别函数,其中判别系数的确定原则是使得类间的区别最大,而且类内的离差最小使得类间的区别最大,而且类内的离差最小,利用判别函数计算出待判样品的判别指标,然后与判别临界值进行比较,判别它的类属。Fisher判别对各类分布、方差都没有限制。但当总体个数较多时,计算比较麻烦。第23页,此课件共28页哦BayesBayes判别法:判别法:在考虑先验概率的前提下,利用Bayes公式计算样品来自第i类的后验概率,使用错判损失最小的概念作判别准则使用错判损失最小的概念作判别准则,建立判别函数,将待判样品归入来自概率最大类。Bayes判别主要用于多类判别,它要求总体呈多元正态分布.第24页,此课件共28页哦逐步判别法:逐步判别法:逐步判别法与逐步回归法的基本思想类似,都是逐步引入变量,每引入一个“最重要”的变量进入判别式,同时也考虑较早引入判别式的某些变量,若其判别能力不显著了,应及时从判别式中剔除去,直到判别式中没有不重要的变量需要剔除,且也没有重要的变量要引入为止。第25页,此课件共28页哦利用表格中的数据判断待判国家的人口发展水平第26页,此课件共28页哦结果解读第27页,此课件共28页哦感谢您的关注第28页,此课件共28页哦