《数据挖掘期末考试计算题及答.pdf》由会员分享,可在线阅读,更多相关《数据挖掘期末考试计算题及答.pdf(3页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、题一:一阶项目集支持度a 5 b 4 c 2 d 5 e 3 f 4 g 6 一阶频繁集支持度a 5 b 4 d 5 f 4 g 6 二阶候选集支持度ab 3 ad 4 af 2 ag 5 bd 3 bf 1 bg 3 df 3 dg 4 fg 3 二阶频繁集支持度ad 4 ag 5 dg 4 三阶候选集支持度adg 4 三阶频繁集支持度adg 4 题二Distance(G,A)2=0.1;Distance(G,B)2=0。03;Distance(G,C)2=0。11 Distance(G,D)2=0.12;Distance(G,E)2=0.16;Distance(G,F)2=0.05 G 的
2、三个最近的邻居为B,F,A,因此 G 的分类为湖泊水Distance(H,A)2=0。03;Distance(H,B)2=0。18;Distance(H,C)2=0。22 Distance(H,D)2=0。03;Distance(H,E)2=0.21;Distance(H,F)2=0.16 H 的三个最近的邻居为A,D,F,因此 H 的分类为冰川水题三首先计算各属性的信息增益Gain(Ca+浓度)=0 Gain(Mg+浓度)=0。185 Gain(Na+浓度)=0 Gain(Cl浓度)=0。32 选择 Cl浓度作为根节点计算各属性的信息增益Gain(Ca+浓度)=0 Gain(Mg+浓度)=0
3、。45 Gain(Na+浓度)=0。24 选择 Mg+浓度作为节点计算各属性的信息增益Gain(Ca+浓度)=0。24 Gain(Na+浓度)=0。91 题四P(Ca+浓度=低,Mg+浓度=高,Na+浓度=高,Cl浓度=低|类型=冰川水)*P(冰川水)=P(Ca+浓度=低|类型=冰川水)*P(Mg+浓度=高 类型=冰川水)P(Na+浓度=高 类型=冰川水)P(Cl浓度=低 类型=冰川水)*P(冰川水)=0。50.750.50.50。5=0。0468 P(Ca+浓度=低,Mg+浓度=高,Na+浓度=高,Cl浓度=低 类型=湖泊水)P(湖泊水)=P(Ca+浓度=低 类型=湖泊水)*P(Mg+浓度=
4、高 类型=湖泊水)P(Na+浓度=高 类型=湖泊水)*P(Cl浓度=低 类型=湖泊水)P(湖泊水)=0。5*0。250。51*0。5=0。03123 第一个样本为冰川水P(Ca+浓度=高,Mg+浓度=高,Na+浓度=低,Cl浓度=高 类型=冰川水)P(冰川水)=P(Ca+浓度=高|类型=冰川水)*P(Mg+浓度=高 类型=冰川水)P(Na+浓度=低|类型=冰川水)P(Cl浓度=高|类型=冰川水)*P(冰川水)=0。50.750.5*0。5*0。5=0。0468 P(Ca+浓度=高,Mg+浓度=高,Na+浓度=低,Cl-浓度=高 类型=湖泊水)*P(湖泊水)=P(Ca+浓度=高 类型=湖泊水)*
5、P(Mg+浓度=高 类型=湖泊水)*P(Na+浓度=低|类型=湖泊水)P(Cl浓度=高 类型=湖泊水)P(湖泊水)=0.5*0。250。50*0.5=0 第二个样本为冰川水题五A,B,C,D,E,F,G 之间的距离矩阵如下表Cl-浓度冰川水?高低Cl-浓度冰川水Mg+浓度高低高低?湖泊水高低Cl-浓度冰川水Mg+浓度高低Na+浓度湖泊水高低湖泊水冰川水A B C D E F G A B 1 C D E F 1.5 G 根据距离矩阵建立的树如下题六第一次迭代以 A,B 作为平均点,对剩余的点根据到A、B 的距离进行分配A,C,D,E,F,G,H,B计算两个簇的平均点(6。5,1.7),(4,5)第二次迭代,对剩余的点根据到平均点的距离进行分配,得到两个簇D,E,F,H和 A,B,C,G计算两个簇的平均点(9。1,0.5),(3。25,3。75)第三次迭代,对剩余的点根据到平均点的距离进行分配,得到两个簇D,E,F,H 和A,B,C,G由于所分配的簇没有发生变化,算法终止。B C D A E F G