数据挖掘技术分类挖掘及其应用学习教案.pptx

上传人:一*** 文档编号:71954934 上传时间:2023-02-07 格式:PPTX 页数:22 大小:232.06KB
返回 下载 相关 举报
数据挖掘技术分类挖掘及其应用学习教案.pptx_第1页
第1页 / 共22页
数据挖掘技术分类挖掘及其应用学习教案.pptx_第2页
第2页 / 共22页
点击查看更多>>
资源描述

《数据挖掘技术分类挖掘及其应用学习教案.pptx》由会员分享,可在线阅读,更多相关《数据挖掘技术分类挖掘及其应用学习教案.pptx(22页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、数据挖掘技术数据挖掘技术(jsh)分类挖掘及其应用分类挖掘及其应用第一页,共22页。第第5章章 分类分类(fn li)挖掘及其应用挖掘及其应用5.1 5.1 分类分类分类分类(fn li)(fn li)概概概概念念念念5.1.15.1.1概述概述概述概述 分类和预测是两种数据分析形式,可以用于描述分类和预测是两种数据分析形式,可以用于描述分类和预测是两种数据分析形式,可以用于描述分类和预测是两种数据分析形式,可以用于描述重要重要重要重要(zhngyo)(zhngyo)数据类的模型或预测未来的数据趋势。数据类的模型或预测未来的数据趋势。数据类的模型或预测未来的数据趋势。数据类的模型或预测未来的数

2、据趋势。然而然而然而然而,分类是预测分类标号(或离散值分类是预测分类标号(或离散值分类是预测分类标号(或离散值分类是预测分类标号(或离散值),),而预测建立而预测建立而预测建立而预测建立连续值函数模型。连续值函数模型。连续值函数模型。连续值函数模型。数据分类(数据分类(数据分类(数据分类(data classificationdata classification)是一个两步过程)是一个两步过程)是一个两步过程)是一个两步过程:第一步,建立一个模型第一步,建立一个模型第一步,建立一个模型第一步,建立一个模型,描述预定的数据类集或概描述预定的数据类集或概描述预定的数据类集或概描述预定的数据类集或

3、概念集念集念集念集 ;第二步,使用模型进行分类。第二步,使用模型进行分类。第二步,使用模型进行分类。第二步,使用模型进行分类。如果认为模型的准确率可以接受如果认为模型的准确率可以接受如果认为模型的准确率可以接受如果认为模型的准确率可以接受,就可以用它对类就可以用它对类就可以用它对类就可以用它对类标号未知的数据元组或对象进行分类。标号未知的数据元组或对象进行分类。标号未知的数据元组或对象进行分类。标号未知的数据元组或对象进行分类。分类具有广泛的应用分类具有广泛的应用分类具有广泛的应用分类具有广泛的应用,包括信誉证实、医疗诊断、包括信誉证实、医疗诊断、包括信誉证实、医疗诊断、包括信誉证实、医疗诊断

4、、性能预测和选择购物。性能预测和选择购物。性能预测和选择购物。性能预测和选择购物。第1页/共22页第二页,共22页。5.1.25.1.2分类分类分类分类(fn li)(fn li)预处预处预处预处理理理理准备分类的数据准备分类的数据 可可以以对对数数据据使使用用下下面面的的预预处处理理以以便便提提高高分分类类过过程程的的准准确确性性、有有效性效性 和可伸缩性。和可伸缩性。1 1)数据清理)数据清理 2 2)相关性分析)相关性分析 3 3)数据变换)数据变换 分类方法分类方法(fngf)(fngf)评估评估 分类方法分类方法(fngf)(fngf)可以根据下列标准进行比较和评估。可以根据下列标准

5、进行比较和评估。1 1)测测的的准准确确率率 2 2)速速度度 3 3)强强壮壮性性 4 4)可可伸伸缩缩性性 5 5)可可解解释释性性 数数据据库库研研究究界界对对数数据据挖挖掘掘的的分分类类的的贡贡献献一一直直强强调调可可伸伸缩缩性性,特特别是别是 对判定树归纳。对判定树归纳。第第5章章 分类挖掘分类挖掘(wju)及其应用及其应用第2页/共22页第三页,共22页。5.2 5.2 分类分类分类分类(fn li)(fn li)挖挖挖挖掘算法掘算法掘算法掘算法5.2.15.2.1决策树分类决策树分类决策树分类决策树分类 决决决决策策策策树树树树学学学学习习习习算算算算法法法法包包包包括括括括如如

6、如如ID3ID3算算算算法法法法(C4.5C4.5),SLISLI(supervised supervised learning in questlearning in quest)算法。)算法。)算法。)算法。5.2.2 5.2.2 贝叶斯分类贝叶斯分类贝叶斯分类贝叶斯分类 贝贝贝贝叶叶叶叶斯斯斯斯分分分分类类类类算算算算法法法法是是是是利利利利用用用用概概概概率率率率统统统统计计计计知知知知识识识识进进进进行行行行(jnxng)(jnxng)分分分分类类类类的的的的分分分分类类类类算法。算法。算法。算法。5.2.3 5.2.3 基于关联规则分类基于关联规则分类基于关联规则分类基于关联规则分

7、类 CBACBA算算算算法法法法(classification classification based based on on associationassociation)是是是是基基基基于于于于关关关关联规则的分类算法。联规则的分类算法。联规则的分类算法。联规则的分类算法。LBLB(Large Large BayesBayes)算算算算法法法法是是是是综综综综合合合合了了了了概概概概率率率率统统统统计计计计和和和和关关关关联联联联规规规规则则则则的的的的知知知知识识识识而提出的分类算法。而提出的分类算法。而提出的分类算法。而提出的分类算法。5.2.4 5.2.4 基于数据库技术分类基于数

8、据库技术分类基于数据库技术分类基于数据库技术分类 在在在在分分分分类类类类算算算算法法法法中中中中,利利利利用用用用数数数数据据据据库库库库技技技技术术术术解解解解决决决决分分分分类类类类问问问问题题题题的的的的算算算算法法法法。目目目目前前前前,有有有有MINDMIND和和和和GAC-RDBGAC-RDB两类。两类。两类。两类。第第5章章 分类挖掘分类挖掘(wju)及其应用及其应用第3页/共22页第四页,共22页。分类分类分类分类(fn li)(fn li)挖掘挖掘挖掘挖掘算法算法算法算法5.2.5 5.2.5 基于支持向量机分类基于支持向量机分类基于支持向量机分类基于支持向量机分类 支支支

9、支持持持持向向向向量量量量机机机机(SVMSVM)分分分分类类类类算算算算法法法法是是是是在在在在有有有有较较较较坚坚坚坚实实实实(jinsh)(jinsh)数数数数学学学学理理理理论基础的统计学理论及优化技术之上发展起来的机器学习方法。论基础的统计学理论及优化技术之上发展起来的机器学习方法。论基础的统计学理论及优化技术之上发展起来的机器学习方法。论基础的统计学理论及优化技术之上发展起来的机器学习方法。One-classOne-class是是是是标标标标准准准准SVMSVM分分分分类类类类算算算算法法法法的的的的改改改改进进进进,该该该该算算算算法法法法(无无无无监监监监督督督督)仅仅仅仅仅仅

10、仅仅需需需需要要要要使使使使用用用用正正正正例例例例作作作作为为为为输输输输入入入入数数数数据据据据,通通通通过过过过从从从从正正正正例例例例中中中中识识识识别别别别出出出出孤孤孤孤立立立立点点点点作为反例,然后再使用基于作为反例,然后再使用基于作为反例,然后再使用基于作为反例,然后再使用基于SVMSVM的标准分类技术来完成分类的标准分类技术来完成分类的标准分类技术来完成分类的标准分类技术来完成分类 。其其其其他他他他分分分分类类类类算算算算法法法法还还还还包包包包括括括括神神神神经经经经网网网网络络络络方方方方法法法法,k_k_最最最最邻邻邻邻近近近近分分分分类类类类,粗粗粗粗糙糙糙糙集集集

11、集合方法,模糊集方法等。合方法,模糊集方法等。合方法,模糊集方法等。合方法,模糊集方法等。5.2.6 5.2.6 基于基于基于基于AISAIS模型分类算法模型分类算法模型分类算法模型分类算法 这这这这种种种种分分分分类类类类算算算算法法法法主主主主要要要要用用用用来来来来找找找找寻寻寻寻样样样样本本本本集集集集合合合合中中中中主主主主要要要要类类类类别别别别的的的的分分分分类类类类规规规规则则则则,用用用用于于于于划划划划分分分分主主主主类类类类和和和和其其其其他他他他类类类类。对对对对于于于于其其其其他他他他类类类类,同同同同样样样样可可可可以以以以看看看看做做做做一一一一个个个个样本集合,

12、再次利用该分类算法进行分类。样本集合,再次利用该分类算法进行分类。样本集合,再次利用该分类算法进行分类。样本集合,再次利用该分类算法进行分类。第第5章章 分类挖掘分类挖掘(wju)及其应用及其应用第4页/共22页第五页,共22页。5.35.3人工免疫算法人工免疫算法人工免疫算法人工免疫算法(sun f)(sun f)及其在故障诊断中的及其在故障诊断中的及其在故障诊断中的及其在故障诊断中的应用应用应用应用5.3.15.3.1人工免疫算法人工免疫算法人工免疫算法人工免疫算法5.3.1.15.3.1.1引言引言引言引言 本本本本节节节节阐阐阐阐明明明明了了了了不不不不同同同同免免免免疫疫疫疫算算算算

13、法法法法或或或或免免免免疫疫疫疫理理理理论论论论的的的的原原原原理理理理,同同同同时时时时也也也也提提提提出出出出了了了了常常常常用用用用的的的的人人人人工工工工免免免免疫疫疫疫系系系系统统统统(xtng)(xtng)的的的的一一一一般般般般模模模模型型型型框框框框架架架架。这这这这些些些些技技技技术术术术己己己己经经经经被被被被成成成成功功功功的的的的用用用用于于于于模模模模式式式式识识识识别别别别和和和和数数数数据据据据挖挖挖挖掘掘掘掘、故故故故障障障障检检检检测测测测与与与与诊诊诊诊断断断断、计计计计算算算算机机机机安安安安全及其它各种应用。全及其它各种应用。全及其它各种应用。全及其它各

14、种应用。5.3.1.25.3.1.2典型的人工免疫算法典型的人工免疫算法典型的人工免疫算法典型的人工免疫算法(1 1)克隆选择算法;)克隆选择算法;)克隆选择算法;)克隆选择算法;(2 2)否定选择算法;)否定选择算法;)否定选择算法;)否定选择算法;(3 3)免疫网络算法)免疫网络算法)免疫网络算法)免疫网络算法 ;(4 4)基于信息嫡的免疫算法;)基于信息嫡的免疫算法;)基于信息嫡的免疫算法;)基于信息嫡的免疫算法;(5 5)免疫进化算法;)免疫进化算法;)免疫进化算法;)免疫进化算法;(6 6)其其其其它它它它学学学学习习习习算算算算法法法法:免免免免疫疫疫疫目目目目标标标标算算算算法法

15、法法、免免免免疫疫疫疫AgentAgent算算算算法法法法、免免免免疫疫疫疫DNADNA算算算算法法法法、基基基基于于于于人人人人工工工工免免免免疫疫疫疫系系系系统统统统(xtng)(xtng)的无监督学习策略。的无监督学习策略。的无监督学习策略。的无监督学习策略。第第5章章 分类挖掘分类挖掘(wju)及其应用及其应用第5页/共22页第六页,共22页。5.3.25.3.2基于否定选择算法基于否定选择算法基于否定选择算法基于否定选择算法(sun f)(sun f)的故障诊的故障诊的故障诊的故障诊断方法断方法断方法断方法 在在在在现现现现阶阶阶阶段段段段的的的的故故故故障障障障诊诊诊诊断断断断领领

16、领领域域域域,常常常常用用用用的的的的诊诊诊诊断断断断方方方方法法法法包包包包括括括括模模模模糊糊糊糊诊诊诊诊断断断断、专专专专家家家家系系系系统统统统(zhun(zhun(zhun(zhun ji ji ji ji x x x x tn)tn)tn)tn)、人人人人工工工工神神神神经经经经网网网网络络络络等等等等,主主主主要要要要思思思思想想想想是是是是将将将将人人人人们们们们掌掌掌掌握握握握的的的的有有有有关关关关故故故故障障障障的的的的知知知知识识识识加加加加工工工工成成成成智智智智能能能能诊诊诊诊断断断断系系系系统统统统所所所所能能能能接接接接受受受受的的的的语语语语言言言言或或或或语

17、语语语法法法法,并并并并将将将将其其其其存存存存储储储储记记记记录录录录下下下下来来来来,诊诊诊诊断断断断过过过过程程程程的的的的实实实实质质质质是是是是待待待待诊诊诊诊样样样样本本本本与与与与系系系系统统统统所所所所记记记记忆忆忆忆的的的的故故故故障知识的匹配过程。障知识的匹配过程。障知识的匹配过程。障知识的匹配过程。第第5章章 分类分类(fn li)挖掘及其应用挖掘及其应用第6页/共22页第七页,共22页。5.3.2.15.3.2.1基于基于基于基于aiNetaiNet故障样本故障样本故障样本故障样本(yngbn)(yngbn)约减研约减研约减研约减研究究究究免疫网络模型免疫网络模型免疫网

18、络模型免疫网络模型 )网络定义与描述)网络定义与描述)网络定义与描述)网络定义与描述 【定定定定义义义义】aiNetaiNet是是是是一一一一个个个个边边边边界界界界加加加加权权权权图图图图,无无无无需需需需全全全全部部部部(qunb)(qunb)连连连连接,又称为接,又称为接,又称为接,又称为细胞的节点集合组成,节点对集合称为边界。细胞的节点集合组成,节点对集合称为边界。细胞的节点集合组成,节点对集合称为边界。细胞的节点集合组成,节点对集合称为边界。2 2)网络算法约减过程(如下图)网络算法约减过程(如下图)网络算法约减过程(如下图)网络算法约减过程(如下图)第第5章章 分类挖掘分类挖掘(w

19、ju)及其应用及其应用第7页/共22页第八页,共22页。图图5-1 aiNet算法算法(sun f)流程图流程图 第第5章章 分类分类(fn li)挖掘及其应用挖掘及其应用基于基于基于基于aiNetaiNet故障故障故障故障(gzhng)(gzhng)样本样本样本样本约减研究约减研究约减研究约减研究第8页/共22页第九页,共22页。3)实验(shyn)结果分析 综上分析表明综上分析表明aiNetaiNet网络具网络具有较好的数据约减能力,在样有较好的数据约减能力,在样本压缩率较高的情况本压缩率较高的情况(qngkung)(qngkung)下,仍能保持原有下,仍能保持原有的数据结构和聚类特性的数

20、据结构和聚类特性.第第5章章 分类分类(fn li)挖掘及其应用挖掘及其应用免疫网络模型免疫网络模型第9页/共22页第十页,共22页。5.3.2.25.3.2.2基于基于基于基于(jy)(jy)否定选择算法的变压器故障诊断否定选择算法的变压器故障诊断否定选择算法的变压器故障诊断否定选择算法的变压器故障诊断方法方法方法方法 传统变压器故障诊断方法传统变压器故障诊断方法-三比值法简介三比值法简介 三比值法是三比值法是IECIEC推荐的一种方法推荐的一种方法,是罗杰斯比值法的一种改进。该方法是是罗杰斯比值法的一种改进。该方法是通过计通过计C2H2/C2H4,CH4/H2,C2H4/C2H6C2H2/

21、C2H4,CH4/H2,C2H4/C2H6三种比值三种比值,根据已知的编码规则和故障类根据已知的编码规则和故障类别别,查表确定故障类别。查表确定故障类别。基于否定选择算法基于否定选择算法(sun f)(sun f)故障诊断方法故障诊断方法 1 1)数据处理及编码)数据处理及编码 2 2)匹配原则)匹配原则 3 3)生成检测器)生成检测器 4 4)仿真实验)仿真实验 第第5章章 分类分类(fn li)挖掘及其应用挖掘及其应用第10页/共22页第十一页,共22页。5.3.2.35.3.2.3免疫算法诊断结果和传统免疫算法诊断结果和传统免疫算法诊断结果和传统免疫算法诊断结果和传统(chuntng)“

22、(chuntng)“三比值三比值三比值三比值”诊断结果的的比较诊断结果的的比较诊断结果的的比较诊断结果的的比较 从实例分析的结果来看,基于人工免疫的否定选择算法的故障诊断准确率要高于从实例分析的结果来看,基于人工免疫的否定选择算法的故障诊断准确率要高于IECIEC三三比值法。比值法。(1)(1)检测器的个数检测器的个数 一般情况下,检测器的个数越多,对非我空间的覆盖越好,但生成检测器的时间也越长。一般情况下,检测器的个数越多,对非我空间的覆盖越好,但生成检测器的时间也越长。而如果检测器数量太少,则会导致对非我空间的覆盖过小而造成漏诊。而如果检测器数量太少,则会导致对非我空间的覆盖过小而造成漏诊

23、。(2)(2)正常样本的个数正常样本的个数 否定选择算法是通过对正常样本的学习来生成检测器的,所以否定选择算法是通过对正常样本的学习来生成检测器的,所以(suy)(suy)正常样本越多,则正常样本越多,则对自我空间的描述越完全,但由于生成检测器时,候选检测器要与每个自我集合的元素匹对自我空间的描述越完全,但由于生成检测器时,候选检测器要与每个自我集合的元素匹配,这样自我集合的元素越多,生成检测器的时间也就越长,而如果正常样本少,则会导配,这样自我集合的元素越多,生成检测器的时间也就越长,而如果正常样本少,则会导致误诊现象。致误诊现象。第第5章章 分类分类(fn li)挖掘及其应用挖掘及其应用第

24、11页/共22页第十二页,共22页。免疫算法诊断结果和传统免疫算法诊断结果和传统免疫算法诊断结果和传统免疫算法诊断结果和传统(chuntng)“(chuntng)“三比值三比值三比值三比值”诊断结果的的比诊断结果的的比诊断结果的的比诊断结果的的比较较较较(3)(3)自我集合的半径自我集合的半径自我集合的半径自我集合的半径 自我集合的半径选取非常重要,取得大会造成漏诊,较自我集合的半径选取非常重要,取得大会造成漏诊,较自我集合的半径选取非常重要,取得大会造成漏诊,较自我集合的半径选取非常重要,取得大会造成漏诊,较小。则会造成误诊,通过反复试验选取自我集合半径为小。则会造成误诊,通过反复试验选取自

25、我集合半径为小。则会造成误诊,通过反复试验选取自我集合半径为小。则会造成误诊,通过反复试验选取自我集合半径为0.010.01时效果最好。时效果最好。时效果最好。时效果最好。(4)(4)窗宽及窗口移动步长窗宽及窗口移动步长窗宽及窗口移动步长窗宽及窗口移动步长 窗宽越小对原始数据描述得越好,同时也增加了算法的复窗宽越小对原始数据描述得越好,同时也增加了算法的复窗宽越小对原始数据描述得越好,同时也增加了算法的复窗宽越小对原始数据描述得越好,同时也增加了算法的复杂度。通过对窗口移动步长杂度。通过对窗口移动步长杂度。通过对窗口移动步长杂度。通过对窗口移动步长winstepwinstep选取不同的值选取不

26、同的值选取不同的值选取不同的值1,2,3,4,51,2,3,4,5进行试验,发现当窗口移动步长进行试验,发现当窗口移动步长进行试验,发现当窗口移动步长进行试验,发现当窗口移动步长winstep=1winstep=1时效果最好,因时效果最好,因时效果最好,因时效果最好,因为移动步长越小,数据段之间的交迭越大,这样便能够更好为移动步长越小,数据段之间的交迭越大,这样便能够更好为移动步长越小,数据段之间的交迭越大,这样便能够更好为移动步长越小,数据段之间的交迭越大,这样便能够更好地刻画地刻画地刻画地刻画(khu)(khu)原始数据的特征。原始数据的特征。原始数据的特征。原始数据的特征。第第5章章 分

27、类分类(fn li)挖掘及其应用挖掘及其应用第12页/共22页第十三页,共22页。5.3.35.3.3基于克隆变异机理的故障诊断方法基于克隆变异机理的故障诊断方法基于克隆变异机理的故障诊断方法基于克隆变异机理的故障诊断方法(fngf)(fngf)研研研研究究究究5.3.3.15.3.3.1引言引言 在在本本书书中中,借借鉴鉴免免疫疫系系统统的的克克隆隆变变异异机机理理及及已已有有人人工工免免疫疫系系统统成成果果,结结合合故故障障诊诊断断的的实实际际应应用用,研研究究(ynji)(ynji)具具有有故故障障诊诊断断能能力力,同同时时又又具具有有对对故故障障样样本本的的连连续续学学习习功功能能的的

28、自自适适应应故故障障诊诊断断方方法法。最最后后通通过过对对标标准准样样本本的的分分类类识识别别及及实实际际的的故故障障诊诊断断实实例例验验证证了了本本书书提提出出方法的有效性。方法的有效性。第第5章章 分类挖掘分类挖掘(wju)及其应用及其应用第13页/共22页第十四页,共22页。5.3.3.25.3.3.2免疫免疫免疫免疫(miny)(miny)克隆变异机理与克隆选克隆变异机理与克隆选克隆变异机理与克隆选克隆变异机理与克隆选择算法择算法择算法择算法 当非己抗原模式被当非己抗原模式被当非己抗原模式被当非己抗原模式被B B B B细胞识别时免疫系统将会把与抗原细胞识别时免疫系统将会把与抗原细胞识

29、别时免疫系统将会把与抗原细胞识别时免疫系统将会把与抗原具有具有具有具有(jyu)(jyu)(jyu)(jyu)高亲和力的高亲和力的高亲和力的高亲和力的B B B B细胞进行克隆变异形成大量抗体,即细胞进行克隆变异形成大量抗体,即细胞进行克隆变异形成大量抗体,即细胞进行克隆变异形成大量抗体,即克隆选择原理。克隆选择原理。克隆选择原理。克隆选择原理。De CastroDe CastroDe CastroDe Castro博士依据此原理提出了克隆选择算法。博士依据此原理提出了克隆选择算法。博士依据此原理提出了克隆选择算法。博士依据此原理提出了克隆选择算法。这是一种模拟免疫系统学习过程的进化算法。这是

30、一种模拟免疫系统学习过程的进化算法。这是一种模拟免疫系统学习过程的进化算法。这是一种模拟免疫系统学习过程的进化算法。第第5章章 分类挖掘分类挖掘(wju)及其应用及其应用第14页/共22页第十五页,共22页。5.3.3.35.3.3.3故障诊断方法故障诊断方法故障诊断方法故障诊断方法(fngf)(fngf)研究研究研究研究(1 1)初始化)初始化)初始化)初始化 初始化可采用这种方法进行:用已知抗原进行初始化。初始化可采用这种方法进行:用已知抗原进行初始化。初始化可采用这种方法进行:用已知抗原进行初始化。初始化可采用这种方法进行:用已知抗原进行初始化。(2 2)记忆细胞辨识和人工辨识球的产生)

31、记忆细胞辨识和人工辨识球的产生)记忆细胞辨识和人工辨识球的产生)记忆细胞辨识和人工辨识球的产生 在完成初始化后,对于给定抗原,首先将其与记忆细在完成初始化后,对于给定抗原,首先将其与记忆细在完成初始化后,对于给定抗原,首先将其与记忆细在完成初始化后,对于给定抗原,首先将其与记忆细胞集进行匹配,在记忆细胞集中,找出与抗原同类且激胞集进行匹配,在记忆细胞集中,找出与抗原同类且激胞集进行匹配,在记忆细胞集中,找出与抗原同类且激胞集进行匹配,在记忆细胞集中,找出与抗原同类且激励水平最高的记忆细胞,并将该细胞命名为励水平最高的记忆细胞,并将该细胞命名为励水平最高的记忆细胞,并将该细胞命名为励水平最高的记

32、忆细胞,并将该细胞命名为 。如果在记忆细胞集中相同于抗原类的记忆细胞为空,。如果在记忆细胞集中相同于抗原类的记忆细胞为空,。如果在记忆细胞集中相同于抗原类的记忆细胞为空,。如果在记忆细胞集中相同于抗原类的记忆细胞为空,则将该抗原加入则将该抗原加入则将该抗原加入则将该抗原加入(jir)(jir)记忆细胞,并令其为记忆细胞,并令其为记忆细胞,并令其为记忆细胞,并令其为 。一旦被确定,该细胞将被加入。一旦被确定,该细胞将被加入。一旦被确定,该细胞将被加入。一旦被确定,该细胞将被加入(jir)(jir)到人工辨识球集到人工辨识球集到人工辨识球集到人工辨识球集合,然后对合,然后对合,然后对合,然后对 进

33、行克隆变异,以便产生新的人进行克隆变异,以便产生新的人进行克隆变异,以便产生新的人进行克隆变异,以便产生新的人工辨识球。这一过程模拟了免疫系统克隆变异的自适应工辨识球。这一过程模拟了免疫系统克隆变异的自适应工辨识球。这一过程模拟了免疫系统克隆变异的自适应工辨识球。这一过程模拟了免疫系统克隆变异的自适应进化机理。进化机理。进化机理。进化机理。第第5章章 分类分类(fn li)挖掘及其应用挖掘及其应用第15页/共22页第十六页,共22页。故障诊断方法故障诊断方法故障诊断方法故障诊断方法(fngf)(fngf)研研研研究究究究 (3 3)候选记忆细胞)候选记忆细胞 经过资源经过资源(zyun)(zy

34、un)的竞争后,每类中都删除了一些低辨识水平的人工辨识球,是的竞争后,每类中都删除了一些低辨识水平的人工辨识球,是整个辨识水平得到了提高。当进化条件满足后,选择与训练抗原具有相同类且激励水整个辨识水平得到了提高。当进化条件满足后,选择与训练抗原具有相同类且激励水平最高的人工辨识球作为候选记忆细胞,将该细胞定为。平最高的人工辨识球作为候选记忆细胞,将该细胞定为。(4 4)记忆细胞矩阵的形成)记忆细胞矩阵的形成 首先计算候选记忆细胞首先计算候选记忆细胞 ,两个细胞与给定抗原的激励值,两个细胞与给定抗原的激励值,当满足式(当满足式(5-225-22)和式()和式(5-235-23)两个条件时,可将)

35、两个条件时,可将 取代取代 ,如果只满足式(如果只满足式(5-225-22),直接将),直接将 加入记忆细胞矩阵。加入记忆细胞矩阵。(5-22)(5-23)第第5章章 分类挖掘分类挖掘(wju)及其应用及其应用第16页/共22页第十七页,共22页。故障诊断方法故障诊断方法故障诊断方法故障诊断方法(fngf)(fngf)(fngf)(fngf)研究研究研究研究(5 5)故障诊断过程)故障诊断过程)故障诊断过程)故障诊断过程(guchng)(guchng)图图5-2 基于克隆变异机理基于克隆变异机理(j l)的故障诊断框图的故障诊断框图(6)实验仿真)实验仿真第第5章章 分类挖掘及其应用分类挖掘及

36、其应用第17页/共22页第十八页,共22页。小结小结小结小结(xioji)(xioji)本章阐述了分类概念,论述了决策树分类、贝叶斯分类、基于本章阐述了分类概念,论述了决策树分类、贝叶斯分类、基于关联规则分类、基于数据库技术分类、基于支持向量机的分类、基关联规则分类、基于数据库技术分类、基于支持向量机的分类、基于于AISAIS模型分类算法等分类算法。对课题人工免疫算法及其在故障诊模型分类算法等分类算法。对课题人工免疫算法及其在故障诊断中的应用进行了详细的讨论,以此说明分类挖掘在解决复杂工程断中的应用进行了详细的讨论,以此说明分类挖掘在解决复杂工程问题中的应用情况。问题中的应用情况。本章以人工免

37、疫算法的理论和应用为研究内容做了一些工作。本章以人工免疫算法的理论和应用为研究内容做了一些工作。除了在理论上对人工免疫系统及其算法的基础除了在理论上对人工免疫系统及其算法的基础(jch)(jch)原理和各种类原理和各种类型的免疫算法做了研究和分析外,最主要的是通过对人工免疫算法型的免疫算法做了研究和分析外,最主要的是通过对人工免疫算法的研究分析,提出了新的改进算法,开拓了免疫算法的应用领域。的研究分析,提出了新的改进算法,开拓了免疫算法的应用领域。第第5章章 分类挖掘分类挖掘(wju)及其应用及其应用第18页/共22页第十九页,共22页。习习习习 题题题题 5 51简述判定树分类的主要步骤。2

38、在判定树归纳中,为什么树剪枝是有用的?用一个单独的样 本集计值剪枝的缺点是什么?3给定(i dn)判定树,你有两种可能的选择。(1)将判定树转换成规则,然后对结果规则剪枝。(2)对判定树剪枝,然后将剪枝后的树转换成规则。相对于(2),(1)的优点是什么?4为什么朴素贝叶斯分类称为“朴素”的?简述朴素贝叶斯分类的主要思想。5比较急切分类(如判定树、贝叶斯、神经网络)相对于懒散分类(如,K-最临近、基于案例的推理)的优缺点。第第5章章 分类分类(fn li)挖掘及其应用挖掘及其应用第19页/共22页第二十页,共22页。习习习习 题题题题 5 56下表由雇员数据库的训练数据组成。数据已概化。对于给定

39、的行,count表示department,status,age和salary在该行上具有给定值的元组数。设salary是类标号属性。(1)你将如何修改ID3算法,以便考虑每个概化数据元组(即每一行)的count?(2)使用你修改过的ID3算法,构造给定数据的判定树。(3)给定一个数据样本,它在属性department,status和age上的值分别为“systems”、“junior”和“2024”。该样本的salary的朴素贝叶斯分类是什么?(4)为给定的数据设计一个多层前馈神经网络。标记输入和输出层节点。(5)使用上面得到的多层前馈神经网络,给定训练实例“(sales,senior,313

40、5,46K50K)”,给出后向传播算法一次迭代后的权值。指出(zh ch)你使用的初始权值和偏置以及学习率。第第5章章 分类挖掘分类挖掘(wju)及其应用及其应用第20页/共22页第二十一页,共22页。departmentstatus age salary count salessenior 3135 46K50K 30 Salesjunior 2630 26K30K 40 Salesjunior 3135 31K35K 40 systemsjunior 2125 46K50K 20 systemssenior 3135 66K70K 5 systemsjunior 2630 46K50K 3 systemssenior 4145 66K70K 3 marketing senior 3640 46K50K 10 marketing junior 3135 41K45K 4secretary senior 4650 36K40K 4secretary junior 2630 26K30K 67给定给定(i dn)和描述每个样本的属性数,写一个和描述每个样本的属性数,写一个K-最临近分类算法。最临近分类算法。第第5章章 分类挖掘分类挖掘(wju)及其应用及其应用习习 题题 5第21页/共22页第二十二页,共22页。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 管理文献 > 管理工具

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁