《聚类分析练习题(共2页).docx》由会员分享,可在线阅读,更多相关《聚类分析练习题(共2页).docx(2页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
精选优质文档-倾情为你奉上聚类分析练习题练习题一假设数据挖掘的任务是将8个点聚类成3个簇,A1(2,10),A2(2,5),A3(8,4),B1(5,8),B2(7,5),B3(6,4),C1(1,2),C3(4,9),距离函数是欧几里得距离。假设初始选择A1,B1,C1分别作为每个聚类的中心,用k平均算法来给出:1.第一次循环执行后的三个聚类中心;2.最后的三个簇。答:1.第一轮A1(2,10)B1(5,8),A3(8,4),B2(7,5),B3(6,4),C2(4,9)C1(1,2),A2(2,5)对应中心分别是(2,10),(6,6),(1.5,3.5)2.最后结果:A1(2,10),B1(5,8),C2(4,9)A3(8,4),B2(7,5),B3(6,4)C1(1,2),A2(2,5)练习题二 给定6维分类样本C=(A,B,A,B,A,A),D=(B,B,A,B,B,A),试求:1.样本间相似性的简单匹配系数;Jaccard系数。答:A的编码为0、B的编码为1101220021. 所以简单匹配系数d(A,B)=(2+0)/(2+2+0)=1/2 2.Text1Text2Text3Text4Text5Text6cABABAAdBBABBAD(c,d)=(B+B+A+A)/(A+B+B+A+B+A+B+A)=1/2专心-专注-专业