2023年实验三K均值聚类算法实验报告.docx

上传人:太** 文档编号:72763381 上传时间:2023-02-13 格式:DOCX 页数:5 大小:53.04KB
返回 下载 相关 举报
2023年实验三K均值聚类算法实验报告.docx_第1页
第1页 / 共5页
2023年实验三K均值聚类算法实验报告.docx_第2页
第2页 / 共5页
点击查看更多>>
资源描述

《2023年实验三K均值聚类算法实验报告.docx》由会员分享,可在线阅读,更多相关《2023年实验三K均值聚类算法实验报告.docx(5页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、实验三K-Mean s聚类算法一、实验目的加深对非监督学习的理解和结识1) 掌握动态聚类方法K-Me a ns算法的设计方法二、实验环境1) 具有相关编程软件的PC机三、实验原理2) 非监督学习的理论基础动态聚类分析的思想和理论依据3) 聚类算法的评价指标四、算法思想K 一均值算法的重要思想是先在需要分类的数据中寻找K组数据作为初始聚类中 心,然后计算其他数据距离这三个聚类中心的距离,将数据归入与其距离最近的 聚类中心,之后再对这K个聚类的数据计算均值,作为新的聚类中心,继续以上 环节,直到新的聚类中心与上一次的聚类中心值相等时结束算法。实验代码funct io n km (k, A)笔函数名

2、里不要出现-war n ing offn, p=size(A);/输入数据有n个样本,p个属性c i d =one s (k, p+1) /聚类中心组成k行p列的矩阵k表达第几类,p是属性%A(:,p + 1) =100;A(:, p+1)=0;for i =1 :k%c i d(i, :)=A ( i .舟直接取前三个元祖作为聚类中心m= i *f loor (n/k)- f I o o r ( r and ( 1 , 1)*(n/ k )c i d (i t :) =A (m,:);c i d;endA s um=O;Cs u m2=N a N;f I ag s = 1 ;t imes=

3、1 ;wh i Ie fI a gsflag s =0 ;t i mes=t im e s+1 ;%计算每个向量到聚类中心的欧氏距离for i = 1 : nfor j=1:kd i st (i, j)=sq r t (sum ( (A (i, : ) c id (j, : ) ). 2) ;%欧氏距离 end%A(i, p +1) =min (dis t (i, :) ; %与中心的最小距离x , y = f ind ( d i st( i , : ) =min(dist(i,:);c, d= s ize( f ind ( y =A(i, p+1);i f c=0*说明聚类中心变了f lag

4、 s =f lags+ 1 ;A (i, p+ 1 ) =y(1.1);elsecontinue;endendflagsfor j= 1 : kAs u m=0;r , c =f i n d (A(:, p +D=j);cid (j, :) = mean (A(r, :), 1 );for m= 1 : I en g t h (r )Asum=A s u m+ s q r t ( s u m(A( r (m), :)-c i d ( j , :) . 2); endCsum(1r j) = Asum;endsum(C s um (1,:)%if s um (Csum(1,:) )Csum2%

5、b r eak;%en dC s um 2 =s u m(C s um (1,1);Csum;cid; %得到新的聚类中心end t i mesdisp lay (A矩阵,最后一列是所属类别);Afor j=1:ka , b=size(f i n d(A(:, p+1) =j);n u mK(j)=a;endnumKt i mes x I sw r i te ( da t a. x I s , A);五、算法流程图六、实验结果Km e an s6 iter ations,tota 1sum ofd is ta n ces = 20 4.8 2 11 0 iterat i ons,tot a 1

6、s um of distances = 205.8 8616 iteration s ,tota 1s u mo fd is t a nces=2 0 4.82 19 ite ratio ns,t o ta1 s umo fdis t an c e s=2 0 5.8869i ter a t i ons , to t als u m of d i s t ance s= 20 5 . 8 8 68ite r ations,total sumof di s t a nces = 2 04. 8218i teratio n s,total sum o f distanc es =2 0 4. 8

7、2114 ite r ati o ns , t ota1 sum of di s tances= 2 0 5.8861 4 iter a tions, t otal sum o f d istances = 205, 886 6 iterati o n s , tot a 1 s u m of d i st a n c es = 204. 821Ctr s =1. 0 7 54 - 1 .0632 1 . 048 2 1.3902-1. 1 442 -1. 112 1S u mD =6 4.29446 3 . 5 9397 6 . 9 3 29七、实验心得初始的聚类中心的不同,对聚类结果没有很大的影响,而对迭代次数有显 著的影响。数据的输入顺序不同,同样影响迭代次数,而对聚类结果没有太大的 影响。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > 解决方案

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁