《判别分析和聚类分析优秀PPT.ppt》由会员分享,可在线阅读,更多相关《判别分析和聚类分析优秀PPT.ppt(11页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、判别分析和聚类分析第1页,本讲稿共11页一、判别分析一、判别分析二、聚类分析二、聚类分析本讲结构本讲结构 第2页,本讲稿共11页一、判别分析一、判别分析 回归分析回归分析,判别分析判别分析,聚类分析被称为多元统计的三大方法聚类分析被称为多元统计的三大方法.判判别别分分析析(discriminant analysis)是是根根据据要要判判别别对对象象的的若若干干个个指指标标的的观观测测结结果果判判断断其其应应属属于于已已知知类类中中的的哪哪一一类类的的统统计计学学方方法法.经典的判别分析方法有经典的判别分析方法有:Fisher判别和判别和Bayes判别判别,原理都原理都是建立判别函数使得错判率达
2、到最小是建立判别函数使得错判率达到最小.第3页,本讲稿共11页l 判别分析方法判别分析方法SPSS实现步骤实现步骤1.选择选择classifydiscriminant;2.选择选择分分类变类变量量(Grouping Variable),定定义义分分类类范范围围数数(1n);3.选择选择分分类类指指标变标变量量(Independents);4.设设置置统计统计量量Statistics中的中的Fisher系数系数,Classify中的判中的判别别符合率表符合率表Summary table;例例例例:判别分析判别分析判别分析判别分析.sav.sav第4页,本讲稿共11页5.由由Fisher判别函数计
3、算要判别的对象判别函数计算要判别的对象,哪个判别函数计算哪个判别函数计算的值最大的值最大,该判别对象就属于哪一类该判别对象就属于哪一类.第5页,本讲稿共11页二、聚类分析二、聚类分析 聚类分析聚类分析(Cluster Analysis)是按是按”物以类聚物以类聚”的原则将特性的原则将特性相近的对象进行归类相近的对象进行归类.SPSS中的聚类分析按数据的排列位置分为变量聚类中的聚类分析按数据的排列位置分为变量聚类(Variables)和样品和样品(Cases)聚类两类聚类两类.SPSS中的聚类分析按方法分为三种中的聚类分析按方法分为三种:l 两步聚类两步聚类(TwoStep Cluster)l
4、K类中心聚类类中心聚类(K-Means Cluster)l 系统聚类系统聚类(Hierarchical Cluster)第6页,本讲稿共11页l l 系统聚类系统聚类系统聚类系统聚类(Hierarchical Cluster)的基本思想的基本思想的基本思想的基本思想(1)相近的聚为一类相近的聚为一类(以距离表示以距离表示);(2)相似的聚为一类相似的聚为一类(以相似系数表示以相似系数表示);最短距离法最短距离法(single linkage)最长距离法最长距离法(complete linkage)中间距离法中间距离法(median method)可变距离法可变距离法(flexible medi
5、an)重心法重心法(centroid)类平均法类平均法(average)可变类平均法可变类平均法(flexible average)Ward最小方差法最小方差法(Wards minimum variance)第7页,本讲稿共11页构造构造n个类,每个类包含且只包含一个样品。个类,每个类包含且只包含一个样品。计算计算n个样品两两间的距离,构成距离矩阵,记作个样品两两间的距离,构成距离矩阵,记作D0;合并距离最近的两类为一新类合并距离最近的两类为一新类;计算新类与当前各类的距离。若类的个数等于计算新类与当前各类的距离。若类的个数等于1,转,转到步骤到步骤(5),否则回到步骤,否则回到步骤(3);画
6、聚类图画聚类图;决定类的个数,及各类包含的样品数,并对类作出解决定类的个数,及各类包含的样品数,并对类作出解释。释。l l 系统聚类的基本步骤系统聚类的基本步骤系统聚类的基本步骤系统聚类的基本步骤第8页,本讲稿共11页u聚类聚类(cluster)分成几类?分成几类?每个样品属于哪一类?每个样品属于哪一类?u判别判别(discriminate)已知分成几类已知分成几类;根据训练样品建立判别函数根据训练样品建立判别函数;根据判别函数对待判样品进行归类根据判别函数对待判样品进行归类.l l 聚类与判别的区别聚类与判别的区别聚类与判别的区别聚类与判别的区别第9页,本讲稿共11页例例例例:聚类分析聚类分析聚类分析聚类分析.sav .sav 对对对对1111项血常规和生化指标进行聚类项血常规和生化指标进行聚类项血常规和生化指标进行聚类项血常规和生化指标进行聚类.1.选择聚类方式选择聚类方式 ClusterVariables;2.选择选择要聚要聚类类的的11个个变变量量;3.设设置其他需要的置其他需要的选项选项(可以采用默可以采用默认值认值);第10页,本讲稿共11页聚类结果聚类结果(冰状聚类图冰状聚类图):说明说明:空白处的叉起连接作用空白处的叉起连接作用,那些是一类是一目了然那些是一类是一目了然第11页,本讲稿共11页