《模糊聚类分析.pptx》由会员分享,可在线阅读,更多相关《模糊聚类分析.pptx(28页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、会计学1模糊聚类分析模糊聚类分析 二、模糊聚类分析的步骤二、模糊聚类分析的步骤 应用模糊聚类分析对事物进行分类,一般应用模糊聚类分析对事物进行分类,一般按如下四个步骤进行按如下四个步骤进行 1选择统计指标选择统计指标 根据实际问题,选择那些具有明确的意义,根据实际问题,选择那些具有明确的意义,有较强的分辨力和代表性的特征,作为分类有较强的分辨力和代表性的特征,作为分类争物的统计指标统计指标选择如何对分类争物的统计指标统计指标选择如何对分类效果有直接的影响效果有直接的影响第1页/共28页2数据标准化数据标准化(正规化正规化)把代表事物各特征的统计指标的数据进行把代表事物各特征的统计指标的数据进行
2、处理,使之便于分析和比较数据标准化可处理,使之便于分析和比较数据标准化可这样进行:令这样进行:令 其中其中x为原始数据;为原始数据;为原始数据的标准差为原始数据的标准差为原始数据的平均值,为原始数据的平均值,第2页/共28页 3标定标定 所谓标定,就是根据实际情况,按一个准所谓标定,就是根据实际情况,按一个准则或其一种方法,给论域则或其一种方法,给论域U中的元素两两之中的元素两两之间都赋以区间间都赋以区间0,1内的一个数,叫做相似系内的一个数,叫做相似系数。它的大小表征两个元素彼此接近或相似数。它的大小表征两个元素彼此接近或相似的程度。亦即的程度。亦即U与与U之间的关系矩阵。之间的关系矩阵。标
3、定方法有标定方法有(1)数量积法数量积法第3页/共28页 标定方法有标定方法有(1)数量积法数量积法 设设U=u1,u2,un,ui=xi1,xi2,xim 则则第4页/共28页(2)夹角余弦法夹角余弦法 设设U=u1,u2,un,ui=xi1,xi2,xim 则则第5页/共28页(3)相关系数法相关系数法 设设U=u1,u2,un,ui=xi1,xi2,xim 则则第6页/共28页(4)最大最小法最大最小法 设设U=u1,u2,un,ui=xi1,xi2,xim 则则第7页/共28页(5)算术平均最小法算术平均最小法 设设U=u1,u2,un,ui=xi1,xi2,xim,则,则第8页/共2
4、8页(6)几何平均最小法几何平均最小法 设设U=u1,u2,un,ui=xi1,xi2,xim,则则第9页/共28页(7)绝对指数法绝对指数法 设设 U=u1,u2,un,ui=xi1,xi2,xim,则则(8)贴近度贴近度(或距离法或距离法)等标定方法等标定方法第10页/共28页 依次取依次取 的截矩阵的截矩阵R。4聚类方法聚类方法 把关系矩阵把关系矩阵改造为模糊等价矩阵改造为模糊等价矩阵R。R 是普通的等价关系矩阵,据此对是普通的等价关系矩阵,据此对U分类。分类。得到不同水平得到不同水平 的的U分类。分类。确定确定U的最佳分类和分类的阈值。的最佳分类和分类的阈值。第11页/共28页以环境分
5、类为例,说明聚类分析方法。以环境分类为例,说明聚类分析方法。设某城市五个区域,记为设某城市五个区域,记为U=u1,u2,u3,u4,u5 以污染物在空气、水、土壤和植物中超限度以污染物在空气、水、土壤和植物中超限度评价每个区域的污染程度评价每个区域的污染程度.对这五个区域情况如下。对这五个区域情况如下。1542u51351u43255u35432u22355u1植物植物土壤土壤水水空气空气指标指标区域区域第12页/共28页试把这五个区域进行分类。试把这五个区域进行分类。第一步:先按绝对值减数法进行标定取第一步:先按绝对值减数法进行标定取c0.1,则,则得模糊矩阵为得模糊矩阵为第13页/共28页
6、具有自反、对称,故具有自反、对称,故是相似模糊矩阵。是相似模糊矩阵。第14页/共28页第15页/共28页 第二步:取第二步:取R的的 的截关系。的截关系。即取定即取定 的值的值 0,R中的元素大于或等于中的元素大于或等于 0,则取则取为为1,否则为零。,否则为零。当当0.8 1时时第16页/共28页得到得到U=u1,u2,u3,u4,u5 的分类:的分类:u1,u2,u3,u4,u5这种分类为最细的分类,在实际应用中没有意义。这种分类为最细的分类,在实际应用中没有意义。根据根据R0.8 1,第17页/共28页 当当0.6 0.8时时根据根据R0.6 1,得到,得到U=u1,u2,u3,u4,u
7、5 的分类:的分类:u1,u3,u2,u4,u5第18页/共28页 当当0.5 0.6时时根据根据R0.5 1,得到,得到U=u1,u2,u3,u4,u5 的分类:的分类:u1,u3,u2,u4,u5第19页/共28页 当当0.4 0.5时时根据根据R0.4 1,得到,得到U=u1,u2,u3,u4,u5 的分类:的分类:u1,u3,u4,u5,u2 第20页/共28页 当当0 1时时根据根据R0.4 1,得到,得到U=u1,u2,u3,u4,u5 的分类:的分类:u1,u2,u3,u4,u5 即即U中的元素就分为一类,这是最粗的分类,也中的元素就分为一类,这是最粗的分类,也没有应用价值。没有
8、应用价值。第21页/共28页 随着随着 的值的变化,的值的变化,U=u1,u2,u3,u4,u5 聚类聚类分析如下。分析如下。u1,u2,u3,u4,u5 u1,u3,u4,u5,u2 u1,u3,u4,u5,u2 u1,u3,u4,u5,u2 u1,u2,u3,u4,u5 0.8 1最细最细 0 1最粗最粗第22页/共28页显然显然 U=u1,u2,u3,u4,u5 的最细最粗的分类不的最细最粗的分类不具有应用价值,通常称为平凡的分类。除此之具有应用价值,通常称为平凡的分类。除此之外,还有三种分类,其中那一种分类最佳?对外,还有三种分类,其中那一种分类最佳?对应的应的 值是什么?有什么特殊的
9、意义?值是什么?有什么特殊的意义?解决这个问题,借用概率论和数理统计中的解决这个问题,借用概率论和数理统计中的F统统计量的方法。计量的方法。第23页/共28页F统计量的计算方法如下。统计量的计算方法如下。设设 U=u1,u2,un,ui=xi1,xi2,xim 记记称为称为 U=u1,u2,un 的中心。的中心。第24页/共28页当在当在 值值(能够取的数值中最小的数值能够取的数值中最小的数值)U=u1,u2,un 分为分为c 类,类,第一类记为第一类记为第一类类中心第一类类中心第25页/共28页U=u1,u2,un 分为分为c 类的第类的第q 类记为类记为第第q类类中心类类中心这里这里 q =1,2,c第26页/共28页这时这时F统计量为统计量为对所有的不平凡分类,每一种分类得对所有的不平凡分类,每一种分类得到一个到一个F值,取值,取F值最大对应的分类是值最大对应的分类是最佳分类,临界的最佳分类,临界的 值称为阈值。值称为阈值。第27页/共28页