《数据挖掘第三版第八章课后习题答案(共2页).doc》由会员分享,可在线阅读,更多相关《数据挖掘第三版第八章课后习题答案(共2页).doc(2页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、精选优质文档-倾情为你奉上6.2(a)能确定项集A是否频繁,并且能确定项集A的支持度6.3(b)因为s包含s,则项集s的频数小于或者等于s的频数,所以项集s的任意非空子集s的支持度至少与s的支持度一样大。设任务相关的数据D是数据库事务的集合,|D|是D 的事务量,由定义得:.设s是s的非空子集,由定义得:.由频繁项集的所有非空子集一定也是频繁的可知:support(s) support(s)(d)因为d中的频繁项集都是来自d的所有分区之内的,所以在d中频繁的项集至少在d的一个分区中是频繁的。6.6(a)Apriori算法最小支持度计数=3C1C2C3C4C5项集支持度计数项集支持度计数项集支持
2、度计数项集支持度计数项集支持度M3M3M,O1M,K3O,K,E3O4O4M,E2O,K3N2K5M,K3O,E3K5E4M,Y2K,E4E4Y3O,E3K,Y3Y3O,K3D1O,Y2A1K,E4U1K,Y3C2E,Y2I1FP-growth树算法K5 E 4O3M3Y3 Null K:5 E:4 M:1 O:3 OM:1 OY:1 M:1 OY:1Y:1项条件模式基条件FD模式产生的频繁模式YK,E,O,D:1K,E,O:1K,M:1K,Y:3MK,E,O:1K,E:1K:1K,M:3OK,E:3K,O:3E,O:3K,E,O:3EK:4K,E:46.146.14(a)支持度=2000/5000*100%=40%25%,置信度=2000/3000*100%=66.7%50%则该关联规则是强规则(b)P(AUB)=40%P(A)p(B)=2500/5000*3000/5000*100%=30%P(AUB) P(A)p(B)所以不是独立的,两者之间是正相关的。(c)全置信度=0.67最大置信度=0.80Kulczynski=0.57余弦=0.73提升度=1.33根据数据显示,都表示两者之间存在正相关的关系。专心-专注-专业