实验三k-均值聚类算法实验报告(共4页).doc

上传人:飞****2 文档编号:14951866 上传时间:2022-05-09 格式:DOC 页数:4 大小:24.50KB
返回 下载 相关 举报
实验三k-均值聚类算法实验报告(共4页).doc_第1页
第1页 / 共4页
实验三k-均值聚类算法实验报告(共4页).doc_第2页
第2页 / 共4页
点击查看更多>>
资源描述

《实验三k-均值聚类算法实验报告(共4页).doc》由会员分享,可在线阅读,更多相关《实验三k-均值聚类算法实验报告(共4页).doc(4页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、精选优质文档-倾情为你奉上实验三 K-Means聚类算法 一、 实验目的 1) 加深对非监督学习的理解和认识 2) 掌握动态聚类方法K-Means 算法的设计方法 二、 实验环境 1) 具有相关编程软件的PC机 三、 实验原理 1) 非监督学习的理论基础 2) 动态聚类分析的思想和理论依据 3) 聚类算法的评价指标四、算法思想K-均值算法的主要思想是先在需要分类的数据中寻找K组数据作为初始聚类中心,然后计算其他数据距离这三个聚类中心的距离,将数据归入与其距离最近的聚类中心,之后再对这K个聚类的数据计算均值,作为新的聚类中心,继续以上步骤,直到新的聚类中心与上一次的聚类中心值相等时结束算法。实验

2、代码function km(k,A)%函数名里不要出现“-”warning offn,p=size(A);%输入数据有n个样本,p个属性cid=ones(k,p+1);%聚类中心组成k行p列的矩阵,k表示第几类,p是属性%A(:,p+1)=100;A(:,p+1)=0;for i=1:k %cid(i,:)=A(i,:); %直接取前三个元祖作为聚类中心 m=i*floor(n/k)-floor(rand(1,1)*(n/k) cid(i,:)=A(m,:); cid;endAsum=0;Csum2=NaN;flags=1;times=1;while flags flags=0; times=

3、times+1; %计算每个向量到聚类中心的欧氏距离 for i=1:n for j=1:k dist(i,j)=sqrt(sum(A(i,:)-cid(j,:).2);%欧氏距离 end %A(i,p+1)=min(dist(i,:);%与中心的最小距离 x,y=find(dist(i,:)=min(dist(i,:); c,d=size(find(y=A(i,p+1); if c=0 %说明聚类中心变了 flags=flags+1; A(i,p+1)=y(1,1); else continue; end end i flags for j=1:k Asum=0; r,c=find(A(:,

4、p+1)=j); cid(j,:)=mean(A(r,:),1); for m=1:length(r) Asum=Asum+sqrt(sum(A(r(m),:)-cid(j,:).2); end Csum(1,j)=Asum; end sum(Csum(1,:) %if sum(Csum(1,:)Csum2 % break; %end Csum2=sum(Csum(1,:); Csum; cid; %得到新的聚类中心 endtimesdisplay(A矩阵,最后一列是所属类别);Afor j=1:k a,b=size(find(A(:,p+1)=j); numK(j)=a;endnumKtim

5、esxlswrite(,A); 五、算法流程图开 始读入要分类的数据设置初始聚类中心计算数据到K个聚类中心的距离将数据分入与其距离最小的聚类计算新的聚类中心聚类中心是否收敛?否输出K个分类好的聚类结 束是六、实验结果Kmeans6 iterations, total sum of distances = 10 iterations, total sum of distances = 16 iterations, total sum of distances = 9 iterations, total sum of distances = .9 iterations, total sum of

6、distances = 8 iterations, total sum of distances = 8 iterations, total sum of distances = 14 iterations, total sum of distances = 14 iterations, total sum of distances = 6 iterations, total sum of distances = Ctrs = SumD =七、实验心得初始的聚类中心的不同,对聚类结果没有很大的影响,而对迭代次数有显着的影响。数据的输入顺序不同,同样影响迭代次数,而对聚类结果没有太大的影响。专心-专注-专业

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 教案示例

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁