2022年用matlab做聚类分析 .pdf

上传人:Q****o 文档编号:26169150 上传时间:2022-07-16 格式:PDF 页数:3 大小:36.58KB
返回 下载 相关 举报
2022年用matlab做聚类分析 .pdf_第1页
第1页 / 共3页
2022年用matlab做聚类分析 .pdf_第2页
第2页 / 共3页
点击查看更多>>
资源描述

《2022年用matlab做聚类分析 .pdf》由会员分享,可在线阅读,更多相关《2022年用matlab做聚类分析 .pdf(3页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、用 matlab 做聚类分析转载一:MATLAB提供了两种方法进行聚类分析:1、利用 clusterdata 函数对数据样本进行一次聚类,这个方法简洁方便,其特点是使用范围较窄,不能由用户根据自身需要来设定参数,更改距离计算方法;2、分步聚类:(1)用 pdist 函数计算变量之间的距离,找到数据集合中两辆变量之间的相似性和非相似性; (2)用 linkage 函数定义变量之间的连接;(3)用 cophenetic 函数评价聚类信息; (4)用 cluster 函数进行聚类。下边详细介绍两种方法: 1、一次聚类Clusterdata 函数可以视为pdist、linkage 与 cluster

2、的综合,一般比较简单。【clusterdata 函数:调用格式: T=clusterdata(X,cutoff) 等价于 Y=pdist(X,euclid); Z=linkage(Y ,single); T=cluster(Z,cutoff) 】2、分步聚类(1)求出变量之间的相似性用 pdist 函数计算出相似矩阵,有多种方法可以求距离,若此前数据还未无量纲化,则可用zscore 函数对其标准化【pdist 函数:调用格式:Y=pdist(X,metric ) 说明: X 是 M*N 矩阵,为由M 个样本组成,每个样本有N 个字段的数据集 metirc 取值为: euclidean :欧氏距

3、离(默认) seuclidean :标准化欧氏距离;mahalanobis :马氏距离】pdist 生成一个M*(M-1)/2个元素的行向量,分别表示M 个样本两两间的距离。这样可以缩小保存空间,不过,对于读者来说却是不好操作,因此,若想简单直观的表示,可以用squareform 函数将其转化为方阵,其中x(i,j)表示第 i 个样本与第j 个样本之的距离,对角线均为 0. (2)用 linkage 函数来产生聚类树【linkage 函数:调用格式:Z=linkage(Y ,method ) 说明: Y为 pdist 函数返回的M*(M-1)/2个元素的行向量, method 可取值:sing

4、le :最短距离法(默认) ; complete :最长距离法;average :未加权平均距离法; weighted:加权平均法centroid :质心距离法;median :加权质心距离法;ward :内平方距离法(最小方差算法)】返回的 Z 为一个 (M-1)*3 的矩阵,其中前两列为索引标识,表示哪两个序号的样本可以聚为同一类,第三列为这两个样本之间的距离。另外,除了M 个样本以外,对于每次新产生的类,依次用M+1、M+2、来标识。为了表示Z矩阵,我们可以用更直观的聚类数来展示,方法为:dendrogram(Z), 产生的聚类数是一个n 型树, 最下边表示样本,然后一级一级往上聚类,最

5、终成为最顶端的一类。纵轴高度代表距离列。另外,还可以设置聚类数最下端的样本数,默认为30,可以根据修改dendrogram(Z,n)参数 n 来实现, 1nM 。dendrogram(Z,0)则表 n=M 的情况,显示所有叶节点。(3)用 cophenetic 函数评价聚类信息名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 1 页,共 3 页 - - - - - - - - - 【cophenet 函数 : 调用格式: c=cophenetic(Z,Y) 说明:利用pdist 函数生

6、成的Y和 linkage 函数生成的Z计算 cophenet 相关系数。】cophene 检验一定算法下产生的二叉聚类树和实际情况的相符程度,就是检测二叉聚类树中各元素间的距离和pdist 计算产生的实际的距离之间有多大的相关性,另外也可以用inconsistent 表示量化某个层次的聚类上的节点间的差异性。(4)最后,用cluster 进行聚类,返回聚类列。转载二:Matlab 提供了两种方法进行聚类分析。一种是利用clusterdata 函数对样本数据进行一次聚类,其缺点为可供用户选择的面较窄,不能更改距离的计算方法;另一种是分步聚类: (1)找到数据集合中变量两两之间的相似性和非相似性,

7、用pdist 函数计算变量之间的距离; (2)用 linkage 函数定义变量之间的连接;(3)用 cophenetic 函数评价聚类信息; (4)用 cluster 函数创建聚类。1Matlab 中相关函数介绍1.1 pdist 函数调用格式: Y=pdist(X,metric ) 说明:用 metric 指定的方法计算X 数据矩阵中对象之间的距离。X:一个 mn 的矩阵,它是由m 个对象组成的数据集,每个对象的大小为n。metric 取值如下:euclidean :欧氏距离(默认) ; seuclidean :标准化欧氏距离;mahalanobis :马氏距离; cityblock :布洛

8、克距离;minkowski :明可夫斯基距离; cosine :correlation :hamming :jaccard :chebychev : Chebychev距离。1.2 squareform 函数调用格式: Z=squareform(Y,.) 说明:强制将距离矩阵从上三角形式转化为方阵形式,或从方阵形式转化为上三角形式。1.3 linkage 函数调用格式: Z=linkage(Y , method) 说明:用 method 参数指定的算法计算系统聚类树。Y:pdist 函数返回的距离向量;method :可取值如下:single :最短距离法(默认) ; complete :最长

9、距离法;average :未加权平均距离法;weighted :加权平均法;centroid :质心距离法;median :加权质心距离法;ward :内平方距离法(最小方差算法)返回: Z为一个包含聚类树信息的(m-1) 3 的矩阵。1.4 dendrogram 函数调用格式: H,T, =dendrogram(Z,p , ) 说明:生成只有顶部p 个节点的冰柱图(谱系图)。1.5 cophenet 函数名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 2 页,共 3 页 - - -

10、 - - - - - - 调用格式: c=cophenetic(Z,Y) 说明:利用pdist 函数生成的Y和 linkage 函数生成的Z 计算 cophenet 相关系数。1.6 cluster 函数调用格式: T=cluster(Z, ) 说明:根据linkage 函数的输出Z 创建分类。1.7 clusterdata 函数调用格式: T=clusterdata(X,) 说明:根据数据创建分类。T=clusterdata(X,cutoff) 与下面的一组命令等价:Y=pdist(X, euclid );Z=linkage(Y , single );T=cluster(Z,cutoff);

11、 2. Matlab 程序2.1 一次聚类法X=*11978 12.5 93.5 31908; ;57500 67.6 238.0 15900+;T=clusterdata(X,0.9) 2.2 分步聚类Step1 寻找变量之间的相似性用 pdist 函数计算相似矩阵, 有多种方法可以计算距离,进行计算之前最好先将数据用zscore函数进行标准化。X2=zscore(X); %标准化数据Y2=pdist(X2); %计算距离Step2 定义变量之间的连接Z2=linkage(Y2); Step3 评价聚类信息C2=cophenet(Z2,Y2); /0.94698 Step4 创建聚类,并作出谱系图T=cluster(Z2,6); H=dendrogram(Z2); 分类结果: 加拿大 ,中国,美国,澳大利亚,日本,印尼 ,巴西 ,前苏联 剩余的为一类。引自: http:/ 名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 3 页,共 3 页 - - - - - - - - -

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 技术资料 > 技术总结

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁