《第四讲模糊模式识别优秀课件.ppt》由会员分享,可在线阅读,更多相关《第四讲模糊模式识别优秀课件.ppt(35页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第四讲模糊模式识别第1页,本讲稿共35页什么是模糊模式识别什么是模糊模式识别n 模式模式(pattern):(pattern):供模仿用的标本供模仿用的标本n 模式识别模式识别:判定给定的事物与哪个标本相同或相近判定给定的事物与哪个标本相同或相近声音识别声音识别文字识别文字识别图象识别图象识别景物识别等景物识别等n 模糊模式识别模糊模式识别:标本或待识别的事物具有模糊性时,利用模糊数学方标本或待识别的事物具有模糊性时,利用模糊数学方法处理模式识别问题法处理模式识别问题问题:第2页,本讲稿共35页2022/11/293OUTLINEn一、一、F集的贴近度集的贴近度n二、二、F F模式识别原则模式
2、识别原则n三、几何图形识别三、几何图形识别n四、手写文字识别四、手写文字识别第3页,本讲稿共35页2022/11/294一、一、F集的贴近度集的贴近度n贴近度是用以表示两个模糊集接近程度的数量指标,其定义如下:n定义定义:映射 N:F(U)F(U)0,1称为F(U)上的贴近度,如果满足:1.N(A,A)=12.N(A,B)=N(B,A)3.ABC N(A,C)N(A,B)N(B,C)第4页,本讲稿共35页2022/11/295常见的贴近度公式 第5页,本讲稿共35页2022/11/2962.测度贴近度第6页,本讲稿共35页2022/11/2973.格贴近度第7页,本讲稿共35页内外积性质:性质
3、1性质2证明:第8页,本讲稿共35页性质3证明:同理类似可得:第9页,本讲稿共35页性质4证明:解释:第10页,本讲稿共35页2022/11/2911n例例1:某农作物在A地生长很好,现准备把它移植到B地或C地,问B、C两地哪个最适宜?n已知:论域X=x1,x2,x3,其中,x1气温;x2湿度;x3土壤。根据评定得到三个模糊集 nA=(0.8,0.4,0.6);B=(0.9,0.6,0.3);C=(0.6,0.4,0.5)计算:N1(A,B)=0.80;N1(A,C)=0.90 或者N2(A,B)=0.78;N2(A,C)=0.87从而C地最适宜。第11页,本讲稿共35页2022/11/291
4、2n例例2:设有四本书A1,A2,A3,A4,考虑它们的以下特性:x1科学性;x2逻辑性;x3思想性;x4可读性;x5表述明确性。设论域X=x1,x2,x3,x4,x5,A1=(1,0.8,0.8,0.7,0.6);A2=(0.7,0.9,0.7,0.7,0.5);A3=(0.6,0.8,0,0.5,0.6);A4=(0.7,0.9,1,0.6,0.6)。现要在四本书中找出一本,使之比较符合要求:B=(0.9,0.8,0.7,0.7,0.5).计算:N1(A1,B)=0.94;N1(A2,B)=0.94;N1(A3,B)=0.74;N1(A4,B)=.84 或者 N2(A1,B)=0.92;N
5、2(A2,B)=0.90;N2(A3,B)=0.65;N2(A4,B)=0.82从而,A1最符合要求第12页,本讲稿共35页2022/11/2913n例例3:企业的经营管理状况可以由以下指标反映:u1:生产;u2:销售;u3:材料;u4:存储;u5:运输.因此,企业状况可以表示为U=u1,u2,u3,u4,u5上的模糊集.现有四种不同类型的企业管理经验,它们分别为:A1=(0.9,0.6,0.5,0.7,0.6);A2=(0.5,0.2,0.9,0.4,0.4);A3=(0.3,0.4,0.8,0.5,0.6);A4=(0.7,0.5,0.4,0.1,0.9).现有企业B,其状况为B=(0.4
6、,0.9,0.7,0.8,0.5),问该企业应采取哪种管理措施?计算:N1(A1,B)=0.76;N1(A2,B)=0.70;N1(A3,B)=0.78;N1(A4,B)=.58或者 N2(A1,B)=0.72;N2(A2,B)=0.63;N2(A3,B)=0.73;N2(A4,B)=.56从而,A3最符合要求。.第13页,本讲稿共35页2022/11/2914第14页,本讲稿共35页2022/11/2915第15页,本讲稿共35页2022/11/2916二、二、F F模式识别原则模式识别原则n最大隶属度原则标准类型是一些表示模糊概念的模糊集,待识别对象是论域中的某一元素时,往往由于识别对象不
7、能绝对地属于哪一标准类型,因而隶属度不为1。我们经常选择它对标准类型的隶属度最大的来确定。最大隶属度原则:设A1,A2,An F(U)是n个标准类型,u0U,如果Ai(u0)=maxAk|1kn则认为u0隶属于Ai所代表的标准类型.n邻近原则已知n个标准类型A1,A2,An,B是待识别对象,N为贴近度。如果N(Ai,B)=max N(Ak,B)|k=1,n则认为B与Ai最贴近,判定B属于标准类型Ai.第16页,本讲稿共35页类型例3(小麦亲本识别)小麦的类型及各类小麦对应的参数如下:第17页,本讲稿共35页解解:根据择近原则,A应为早熟型。选定格近度选定格近度第18页,本讲稿共35页例例4 4
8、 细胞染色体形状的模糊识别细胞染色体形状的模糊识别 细胞染色体形状的模糊识别就是几何图形的模糊细胞染色体形状的模糊识别就是几何图形的模糊识别识别,而几何图形常常化为若干个三角图形而几何图形常常化为若干个三角图形,故设论域故设论域为三角形全体为三角形全体.即即X=(A,B,C)|A+B+C=180,ABC 标准模型库标准模型库=E(正三角形正三角形),),R(直角三角形直角三角形),),I(等腰三角形等腰三角形),),IR(等腰直角三角形等腰直角三角形),),T(任意三角形任意三角形).).某人在实验中观察到一染色体的几何形状,测得某人在实验中观察到一染色体的几何形状,测得其三个内角分别为其三个
9、内角分别为94,50,36,94,50,36,即待识别对象为即待识别对象为x0=(94,50,36).=(94,50,36).问问x0应隶属于哪一种三角形?应隶属于哪一种三角形?第19页,本讲稿共35页先建立标准模型库中先建立标准模型库中各种三角形的隶属函数各种三角形的隶属函数.直角三角形的隶属函数直角三角形的隶属函数R(A,B,C)应满足下列约束条件:应满足下列约束条件:(1)(1)当当A=90时时,R(A,B,C)=1;(2)(2)当当A=180时时,R(A,B,C)=0;(3)(3)0R(A,B,C)1.因此因此,不妨定义不妨定义R(A,B,C)=1-|A-90|/90.则则R(x0)=
10、0.955.或者或者其中其中 p=|A 90|则则R(x0)=0.54.第20页,本讲稿共35页正三角形的隶属函数正三角形的隶属函数E(A,B,C)应满足下列约束条件:应满足下列约束条件:(1)当当A=B=C=60时时,E(A,B,C)=1;(2)当当A=180,B=C=0时时,E(A,B,C)=0;(3)0E(A,B,C)1.因此因此,不妨定义不妨定义E(A,B,C)=1 (A C)/180.则则E(x0)=0.677.或者或者其中其中 p=A C 则则E(x0)=0.02.第21页,本讲稿共35页等腰三角形的隶属函数等腰三角形的隶属函数I(A,B,C)应满足下列约束条件:应满足下列约束条件
11、:(1)(1)当当A=B 或者或者 B=C时时,I(A,B,C)=1;(2)(2)当当A=180,B=60,C=0时时,I(A,B,C)=0;(3)(3)0I(A,B,C)1.因此,不妨定义因此,不妨定义I(A,B,C)=1 (A B)(B C)/60.则则I(x0)=0.766.或者或者 p=(A B)(B C)则则I(x0)=0.10.第22页,本讲稿共35页等腰直角三角形的隶属函数等腰直角三角形的隶属函数(IR)(A,B,C)=I(A,B,C)R(A,B,C);(IR)(x0)=0.7660.955=0.766.任意三角形的隶属函数任意三角形的隶属函数T(A,B,C)=IcRcEc=(I
12、RE)c.T(x0)=(0.7660.9550.677)c=(0.955)c=0.045.通过以上计算通过以上计算,R(x0)=0.955最大最大,所以所以x0应隶属应隶属于直角三角形于直角三角形.或者或者(IR)(x0)=0.10;T(x0)=(0.54)c=0.46.仍然是仍然是R(x0)=0.54最大最大,所以所以x0应隶属于直角三角形应隶属于直角三角形.第23页,本讲稿共35页2022/11/2924第24页,本讲稿共35页2022/11/2925第25页,本讲稿共35页DNA序列分类与模糊识别序列分类与模糊识别 2000 2000网易杯全国大学生数学建模竞赛题:生物网易杯全国大学生数
13、学建模竞赛题:生物学家发现学家发现DNA序列是由四种碱基序列是由四种碱基A,T,C,GA,T,C,G按一定顺按一定顺序排列而成序排列而成,其中既没有其中既没有“断句断句”,也没有标点符号也没有标点符号,同时也发现同时也发现DNADNA序列的某些片段具有一定的规律性和结序列的某些片段具有一定的规律性和结构构.由此人工制造两类序列由此人工制造两类序列(A(A类编号为类编号为1 11010;B B类编类编号为号为111120).20).网址:网址:.现在的问题是如何找出比较满意的方法来识别未现在的问题是如何找出比较满意的方法来识别未知的序列知的序列(编号为编号为212140),40),并判断它们那些
14、属于并判断它们那些属于A A类类,那些属于那些属于B B类类,那些既不属于那些既不属于A A类又不属于类又不属于B B类类.第26页,本讲稿共35页(1)(1)已知类别已知类别DNA序列的模糊分类序列的模糊分类 提取已知类别的提取已知类别的20个个DNA序列的序列的A,T,C,GA,T,C,G的百分含的百分含量构成如下矩阵:量构成如下矩阵:X=(xij)204,其中其中xi1,xi2,xi3,xi4分别分别表示第个表示第个DNA系列中的系列中的A,T,C,GA,T,C,G的百分含量的百分含量.采用切采用切比雪夫距离法建立模糊相似矩阵比雪夫距离法建立模糊相似矩阵,然后用传递闭包法然后用传递闭包法
15、进行聚类进行聚类,动态聚类图如下动态聚类图如下.第27页,本讲稿共35页第28页,本讲稿共35页(2)(2)确定最佳分类确定最佳分类将将20个已知个已知DNA序列分成如下序列分成如下3类为最佳:类为最佳:A1 1=1,2,3,5,6,7,8 9,10,=1,2,3,5,6,7,8 9,10,A2 2=4,17,=4,17,A3 3=11,12,13,14,15,16,18,19,20.=11,12,13,14,15,16,18,19,20.建立标准模型库:建立标准模型库:A1,A2,A3.(3)(3)未知未知DNADNA序列的模糊识别序列的模糊识别 采用格贴近度公式:采用格贴近度公式:0(A,
16、B)=A B+(1-A B)/2,将隶属于将隶属于A1的的DNADNA序列序列归为归为A A类类,隶属于隶属于A3的的DNADNA序列序列归为归为B B类类,隶属于隶属于A2的的DNA序列序列归为非归为非A,BA,B类类.第29页,本讲稿共35页2022/11/2930手写文字的识别 手写文字,包括手写数字和英文字母,它们的识别可看成是其手写文字,包括手写数字和英文字母,它们的识别可看成是其印刷体的变形下面介绍的两种方法可供参考。印刷体的变形下面介绍的两种方法可供参考。n(一一)方格矩阵法方格矩阵法 对于一个印刷体字母,首先把它局限在一个框框内,然后对于一个印刷体字母,首先把它局限在一个框框内
17、,然后把这个框框分成很多小方格,在每个小方格上按线条出现的把这个框框分成很多小方格,在每个小方格上按线条出现的清晰程度给予适当的隶属度清晰程度给予适当的隶属度u uijij,而,而i,ji,j是该方格所在的行数和是该方格所在的行数和列数。这样列数。这样,可构成一个模糊关系矩阵,约定:可构成一个模糊关系矩阵,约定:u uijij1 1 表示这一格表示这一格上线条清晰出现,并填上黑色上线条清晰出现,并填上黑色u uijij0 0表示线条不出现,这一格表示线条不出现,这一格成白色。如图成白色。如图 3-4a3-4a及图及图3-4b,3-4b,前者是字母前者是字母H H,后者是数字,后者是数字5.5.
18、这里这里,将字符分成将字符分成 7x57x5个小方格,可得到对应模糊关系矩阵为:个小方格,可得到对应模糊关系矩阵为:第30页,本讲稿共35页2022/11/2931第31页,本讲稿共35页2022/11/2932n这些关系矩阵叫做标准矩阵。使用电脑识别文字时,通常先把这些关系矩阵叫做标准矩阵。使用电脑识别文字时,通常先把 37 37 个文字(包括:个文字(包括:26 26 个字母个字母A,B,.,Z;10A,B,.,Z;10个数字个数字0,1,2,.,9;10,1,2,.,9;1个空白对应的标准矩阵置于内存中,将待识别的文字表示成个空白对应的标准矩阵置于内存中,将待识别的文字表示成 7X5 7
19、X5 阶阶模糊矩阵作为输入,通过光电输入接受每个小方格的信息模糊矩阵作为输入,通过光电输入接受每个小方格的信息由于打印时着色不均匀及可能产生的污点,因而使得通过传由于打印时着色不均匀及可能产生的污点,因而使得通过传感器所获得的信息不一定清晰,即不一定为感器所获得的信息不一定清晰,即不一定为 0 0或或1 1,往往介于,往往介于0-0-l-l 之间,与标准矩阵不一定一致,为了得到正确的识别结果之间,与标准矩阵不一定一致,为了得到正确的识别结果,P.P.Wang,P.P.Wang等人采用下面方法。先把模糊矩阵化为模糊向量,矩阵等人采用下面方法。先把模糊矩阵化为模糊向量,矩阵的第的第i i行放在向量
20、的第行放在向量的第i i个分量上,例如字母个分量上,例如字母 H H 对应的向量为对应的向量为nH=(10001 10001 10001 11111 10001 10001 10001)H=(10001 10001 10001 11111 10001 10001 10001)第32页,本讲稿共35页2022/11/2933第33页,本讲稿共35页2022/11/2934(二)模糊方位转换技术n所谓方位,就是先把待识别的文字固定在一个方框所谓方位,就是先把待识别的文字固定在一个方框框内,框框的位置不能倒置,然后确定各方向的编框内,框框的位置不能倒置,然后确定各方向的编码如图码如图3-53-5所示
21、。图所示。图3-53-5共有八个方向,分别用共有八个方向,分别用0,1,2,3,4,5,6,70,1,2,3,4,5,6,7表示之。现给定一数表示之。现给定一数327327,则可将,则可将它分解为图它分解为图3-63-6的形式。的形式。第34页,本讲稿共35页2022/11/2935n为了识别手写数字,我们先把为了识别手写数字,我们先把 10 10 个数字个数字0,1,2,.,90,1,2,.,9的各个字的的各个字的F F方向方向,用隶属度给定用隶属度给定,叫做叫做号码串号码串F F 向量向量,再存贮到计算机中去作为标准向量再存贮到计算机中去作为标准向量.将待识别的字的号码串将待识别的字的号码串F F向量输入计算机中与标准向量输入计算机中与标准向量比较向量比较,按择近原则按择近原则,就可辨识是什么字了就可辨识是什么字了.第35页,本讲稿共35页