(6.5.1)--6.5关联模式评估.pdf

上传人:刘静 文档编号:57972039 上传时间:2022-11-06 格式:PDF 页数:11 大小:698.30KB
返回 下载 相关 举报
(6.5.1)--6.5关联模式评估.pdf_第1页
第1页 / 共11页
(6.5.1)--6.5关联模式评估.pdf_第2页
第2页 / 共11页
点击查看更多>>
资源描述

《(6.5.1)--6.5关联模式评估.pdf》由会员分享,可在线阅读,更多相关《(6.5.1)--6.5关联模式评估.pdf(11页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、Chapter 6.5关联模式评估测试数据集最小支持度阈值为0.3,最小置信度阈值为0.6。49买苹果手机不买苹果手机行和买小米手机400350750不买小米手机20050250列和60040010006.5 关联模式评估表表6-5 1000个人的手机偏爱个人的手机偏爱1.支持度-置信度框架 强关联规则(支持度-置信度框架)不一定是有趣的2.相关性分析1.提升度令A和B表示不同的项集,(表示项集*在总体数据集中的出现概率。根据统计学定义,如果项集A和项集B的(=(,那么项集A和项集B是相互独立的,否则两者是相互依赖的。项集A和项集B的提升度定义如式(6-3)所示。如果A和B的提升度的值等于1,

2、说明A和B相互独立;若是A和B的提升度的值大于1,说明A和B正相关;如果A和B的提升度的值小于1,说明A和B负相关。Lift(苹果手机,小米手机)=0.4/(0.75*0.6)=0.8950P(AB)lift(A,B)P(A)P(B)=6.5 关联模式评估相关性分析2.杠杆度杠杆度和提升度的含义相近,其定义如式(6-4)所示。A,=((6-4)如果A和B的杠杆度的值等于0,则说明A和B相互独立;如果A和B的杠杆度的值大于0,说明A和B正相关,并且杠杆度越大,说明A和B的关系越密切;如果A和B的杠杆度的值小于0,说明A和B负相关。苹果手机、小米手机 的杠杆度为 苹果手机,小米手机=0.4 0.6

3、 0.75=0.05苹果手机和小米手机是负相关的。516.5 关联模式评估相关性分析3.皮尔森相关系数皮尔森相关系数能够反映两个变量的相似程度,皮尔森相关系数值越大表明两个变量的相关性越强。对于二元变量,皮尔森相关系数定义如式(6-4)所示。苹果手机和小米手机的皮尔森相关系数为526.5 关联模式评估()()()()(,)()()()()=P AB P ABP AB P ABA BP A P A P B P B(苹果手机,小米手机=(0.40.050.350.2)0.60.40.750.25=0.2357说明两者一定程度负相关。相关性分析3.IS度量IS度量通常用于处理非对称二元变量,IS度量

4、定义如式(6-5)所示。IS度量的数值越大则说明A和B之间的关联越强。苹果手机和小米手机的IS度量为(苹果手机,小米手机=0.40.60.75=0.5963说明A和B关联一般。53)B(P)A(P)BA(P)B,A(IS=6.5 关联模式评估相关性分析4.确信度确信度能够度量一个规则的强度,同时衡量A和B之间的独立性。确信度定义如式(6-6)所示。确信度越大,A和B关系越紧密。苹果手机和小米手机的确信度为(苹果手机,小米手机=0.60.250.2=0.33541,说明苹果手机和小米手机的关系不紧密。546.5 关联模式评估(,=(3.模式评估度量不包含任何考察项集的事务被称作零事务。提升度、皮

5、尔森相关系数和卡方系数等度量在很大程度上受零事务的影响,因此它们识别关联模式关联关系的能力较差。1.全置信度全置信度反映了规则 和规则 的最小置信度。全置信度定义如式(6-7)所示。_(,=(max(,(=min(|,(|(6-7)对于项集A和B,全置信度越大,说明规则 和规则 的最小置信度越大,那么A和B关系越紧密,反之A和B关系越疏远。苹果手机和小米手机的全置信度为_苹果手机,小米手机=0.4max0.6,0.75=0.5333说明苹果手机和小米手机的关系一般。556.5 关联模式评估3.模式评估度量2.极大置信度极大置信度则反映了规则 和规则 的最大置信度。极大置信度定义如式(6-8)所

6、示。max_(,=max(|,(|(6-8)对于项集A和B,极大置信度越大,A和B关系越紧密。苹果手机和小米手机的极大置信度为max_(苹果手机,小米手机 =max(0.40.6,0.40.75)=0.667说明两者可能关系一般。566.5 关联模式评估3.模式评估度量Kulczynski度量Kulczynski度量表示在项集A存在的情况下项集B也存在的条件概率和在项集B存在的情况下项集A也存在的条件概率之和的平均值。Kulczynski度量定义如式(6-9)所示。(,=12(|+(|(6-9)对于项集A和B,Kulczynski度量越大,说明平均可信程度越大,那么A和B关系越紧密。苹果手机和小米手机的.(库尔钦斯基)Kulczynski度量为(苹果手机,小米手机 =12(0.40.6+0.40.75)=0.6说明两者关系一般。576.5 关联模式评估THANKS FOR YOUR ATTENTION感谢指导!

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 大学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁