matlab聚类分析.wps

上传人:asd****56 文档编号:79327474 上传时间:2023-03-21 格式:WPS 页数:6 大小:33KB
返回 下载 相关 举报
matlab聚类分析.wps_第1页
第1页 / 共6页
matlab聚类分析.wps_第2页
第2页 / 共6页
点击查看更多>>
资源描述

《matlab聚类分析.wps》由会员分享,可在线阅读,更多相关《matlab聚类分析.wps(6页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、说明:如果是要用 matlab 做 kmeans 聚类分析,直接使用函数 kmeans 即可。使用方法:kmeans(输入矩阵,分类个数 k)。转载一:MATLAB 提供了两种方法进行聚类分析:1、利用 clusterdata 函数对数据样本进行一次聚类,这个方法简洁方便,其特点是使用范围较窄,不能由用户根据自身需要来设定参数,更改距离计算方法;2、分步聚类:(1)用 pdist 函数计算变量之间的距离,找到数据集合中两辆变量之间的相似性和非相似性;(2)用 linkage 函数定义变量之间的连接;(3)用 cophenetic 函数评价聚类信息;(4)用 cluster 函数进行聚类。下边详

2、细介绍两种方法:1、一次聚类Clusterdata 函数可以视为 pdist、linkage 与 cluster 的综合,一般比较简单。【clusterdata 函数:调用格式:T=clusterdata(X,cutoff)等价于 Y=pdist(X,euclid);Z=linkage(Y,single);T=cluster(Z,cutoff)】2、分步聚类(1)求出变量之间的相似性用 pdist 函数计算出相似矩阵,有多种方法可以求距离,若此前数据还未无量纲化,则可用 zscore 函数对其标准化【pdist 函数:调用格式:Y=pdist(X,metric)说明:X 是 M*N 矩阵,为由

3、 M 个样本组成,每个样本有 N 个字段的数据集 metirc 取值为:euclidean:欧氏距离(默认)seuclidean:标准化欧氏距离;mahalanobis:马氏距离 】pdist 生成一个 M*(M-1)/2 个元素的行向量,分别表示 M 个样本两两间的距离。这样可以缩小保存空间,不过,对于读者来说却是不好操作,因此,若想简单直观的表示,可以用 squareform 函数将其转化为方阵,其中 x(i,j)表示第 i 个样本与第 j 个样本之的距离,对角线均为 0.(2)用 linkage 函数来产生聚类树【linkage 函数:调用格式:Z=linkage(Y,method)说明

4、:Y 为 pdist 函数返回的 M*(M-1)/2 个元素的行向量,method 可取值:single:最短距离法(默认);complete:最长距离法;average:未加权平均距离法;weighted:加权平均法 centroid:质心距离法;median:加权质心距离法;ward:内平方距离法(最小方差算法)】返回的 Z 为一个(M-1)*3 的矩阵,其中前两列为索引标识,表示哪两个序号的样本可以聚为同一类,第三列为这两个样本之间的距离。另外,除了 M 个样本以外,对于每次新产生的类,依次用 M+1、M+2、来标识。为了表示 Z 矩阵,我们可以用更直观的聚类数来展示,方法为:dendr

5、ogram(Z),产生的聚类数是一个 n 型树,最下边表示样本,然后一级一级往上聚类,最终成为最顶端的一类。纵轴高度代表距离列。另外,还可以设置聚类数最下端的样本数,默认为 30,可以根据修改 dendrogram(Z,n)参数 n 来实现,1nM。dendrogram(Z,0)则表 n=M 的情况,显示所有叶节点。(3)用 cophenetic 函数评价聚类信息【cophenet 函数:调用格式:c=cophenetic(Z,Y)说明:利用 pdist 函数生成的 Y 和 linkage 函数生成的 Z 计算 cophenet 相关系数。】cophene 检验一定算法下产生的二叉聚类树和实际

6、情况的相符程度,就是检测二叉聚类树中各元素间的距离和 pdist 计算产生的实际的距离之间有多大的相关性,另外也可以用 inconsistent 表示量化某个层次的聚类上的节点间的差异性。(4)最后,用 cluster 进行聚类,返回聚类列。转载二:Matlab 提供了两种方法进行聚类分析。一种是利用 clusterdata 函数对样本数据进行一次聚类,其缺点为可供用户选择的面较窄,不能更改距离的计算方法;另一种是分步聚类:(1)找到数据集合中变量两两之间的相似性和非相似性,用 pdist 函数计算变量之间的距离;(2)用 linkage 函数定义变量之间的连接;(3)用 cophenetic

7、 函数评价聚类信息;(4)用 cluster 函数创建聚类。1 Matlab 中相关函数介绍1.1 pdist 函数调用格式:Y=pdist(X,metric)说明:用 metric 指定的方法计算 X 数据矩阵中对象之间的距离。X:一个 m n 的矩阵,它是由 m 个对象组成的数据集,每个对象的大小为 n。metric 取值如下:euclidean:欧氏距离(默认);seuclidean:标准化欧氏距离;mahalanobis:马氏距离;cityblock:布洛克距离;minkowski:明可夫斯基距离;cosine:correlation:hamming:jaccard:chebychev

8、:Chebychev 距离。1.2 squareform 函数 调用格式:Z=squareform(Y,.)说明:强制将距离矩阵从上三角形式转化为方阵形式,或从方阵形式转化为上三角形式。1.3 linkage 函数调用格式:Z=linkage(Y,method)说 明:用method 参数指定的算法计算系统聚类树。Y:pdist 函数返回的距离向量;method:可取值如下:single:最短距离法(默认);complete:最长距离法;average :未加权平均距离法;weighted :加权平均法;centroid:质心距离法;median:加权质心距离法;ward:内平方距离法(最小方

9、差算法)返回:Z 为一个包含聚类树信息的(m-1)3 的矩阵。1.4 dendrogram 函数调用格式:H,T,=dendrogram(Z,p,)说明:生成只有顶部 p 个节点的冰柱图(谱系图)。1.5 cophenet 函数调用格式:c=cophenetic(Z,Y)说明:利用 pdist 函数生成的 Y 和 linkage 函数生成的 Z 计算 cophenet 相关系数。1.6 cluster 函数调用格式:T=cluster(Z,)说明:根据 linkage 函数的输出 Z 创建分类。1.7 clusterdata 函数调用格式:T=clusterdata(X,)说明:根据数据创建分

10、类。T=clusterdata(X,cutoff)与下面的一组命令等价:Y=pdist(X,euclid);Z=linkage(Y,single);T=cluster(Z,cutoff);2.Matlab 程序2.1 一次聚类法X=11978 12.5 93.5 31908;57500 67.6 238.0 15900;T=clusterdata(X,0.9)2.2 分步聚类Step1 寻找变量之间的相似性用 pdist 函数计算相似矩阵,有多种方法可以计算距离,进行计算之前最好先将数据用 zscore 函数进行标准化。X2=zscore(X);%标准化数据Y2=pdist(X2);%计算距离

11、Step2 定义变量之间的连接Z2=linkage(Y2);Step3 评价聚类信息 C2=cophenet(Z2,Y2);/0.94698Step4 创建聚类,并作出谱系图 T=cluster(Z2,6);H=dendrogram(Z2);分类结果:加拿大,中国,美国,澳大利亚,日本,印尼,巴西,前苏联剩余的为一类。X=0.0088113720.240079413 0.7511092150.015781954 0.524716894 0.4595011520.125663299 0.525034005 0.3493026960.060263932 0.568859867 0.37087620

12、10.093838245 0.545552605 0.360609150.088370599 0.540536060.3710933420.121158386 0.519904056 0.3589375580.125658237 0.484650773 0.389690990.006649781 0.420501480.5728487390.061317334 0.525134048 0.4135486180.049078161 0.515755361 0.4351664780.139895933 0.520790366 0.3393137010.092533005 0.510468124 0

13、.3969988710.127705724 0.542031433 0.3302628430.091608074 0.542214419 0.3661775070.141089521 0.572759995 0.2861504840.134459697 0.486437231 0.3791030720.144999738 0.457863095 0.3971371670.049702845 0.500173864 0.4501232910.175035136 0.471447306 0.3535175580.261482199 0.276580286 0.4619375150.08647695

14、2 0.550006435 0.3635166130.144476034 0.504622507 0.3509014590.135812314 0.391133729 0.4730539570.153426410.446208428 0.4003651630.135419540.323020534 0.5415599260.097639349 0.537967181 0.3643934690.145429837 0.481701147 0.3728690170.099908918 0.551402146 0.3486889360.094273962 0.489989051 0.4157369870.198369830.476719872 0.324910298;X2=zscore(X);%标准化数据Y2=pdist(X2);Z=squareform(Y2);Z2=linkage(Y2,single)C2=cophenet(Z2,Y2)T=cluster(Z2,6)H=dendrogram(Z2)

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > 财经金融

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁