《模糊模式识别西安电子科技大学PPT教案.pptx》由会员分享,可在线阅读,更多相关《模糊模式识别西安电子科技大学PPT教案.pptx(106页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、模糊模糊(m hu)模式识别西安电子科技大学模式识别西安电子科技大学第一页,共106页。8.1 模模 糊糊 集集 合合8.1.1模糊子集的概念模糊子集的概念模糊集合也称模糊子集模糊集合也称模糊子集,是由其隶属函数来是由其隶属函数来定义的。定义的。定义定义8.1给定论域给定论域U,如果如果(rgu)对任意对任意的的u U,都确定了一个数都确定了一个数,表示表示u属于的程度属于的程度,则称为论域则称为论域U上的一个上的一个模糊子集模糊子集;称映射称映射第1页/共106页第二页,共106页。(8-1)为的隶属函数;称为u对的隶属度。隶属函数是模糊性的一种度量,表示(biosh)元素u具有性质的程度,
2、或u属于的程度。【例 8.1】取论域U是实数集R,模糊子集表示(biosh)“远大于1的实数”,其隶属函数可以选择为(如图8-1所示)第2页/共106页第三页,共106页。图 8-1例8.1中隶属(lsh)函数的示意图 第3页/共106页第四页,共106页。【例【例 8.2】以年龄作论域】以年龄作论域,取取U=0,200,模糊子集模糊子集表示表示(biosh)“年老年老”,表示表示(biosh)“年轻年轻”,它们的隶属函数可以选择为它们的隶属函数可以选择为(如图如图8-2所示所示)第4页/共106页第五页,共106页。若U为有限集合或可数集合,则模糊(m hu)子集可表示为(8-2)第5页/共
3、106页第六页,共106页。若为无限(wxin)不可数集,则可表示为:(8-3)其中,“”与“”并不是求和与积分(jfn),而是表示模糊子集 中各个元素与隶属度的对应关系。第6页/共106页第七页,共106页。图 8-2例8.2中隶属(lsh)函数的示意图第7页/共106页第八页,共106页。当的值域为0,1时,退化为一个普通(ptng)子集的特征函数,便退化成一个普通(ptng)子集,因此,普通(ptng)子集是模糊子集的特殊形态。若把论域U上全部模糊子集所组成的集合记作F(U),则有,其中P(U)是U的幂集。当时,称为真模糊子集。此时,至少存在一个元素u0,使。第8页/共106页第九页,共
4、106页。如果存在至少一个元素u0U,使得,则称为正规模糊子集(z j)(Normal),否则称为非正规模糊子集(z j)。如果对任意的u1,u2U,0,1,都有则称为凸模糊子集(z j)(Convex)。假设论域U为实数域R,如果既是正规模糊子集(z j),又是凸模糊子集(z j),则称为模糊数(Fuzzy Number)。第9页/共106页第十页,共106页。8.1.2隶属函数的确定隶属函数的确定隶属函数的确定需要隶属函数的确定需要(xyo)对描述的概念进对描述的概念进行充分的了解行充分的了解,经过人脑的加工和某种心理过程经过人脑的加工和某种心理过程,采采用一定的数学方法来表达。用一定的数
5、学方法来表达。确定隶属函数的方法有确定隶属函数的方法有许多许多,如模糊统计法、如模糊统计法、模糊分布、模糊分布、专家打分法、专家打分法、推推理法和对比排序法等。理法和对比排序法等。这里主要介绍模糊统计法与这里主要介绍模糊统计法与模糊分布。模糊分布。第10页/共106页第十一页,共106页。1.模糊统计法模糊统计法在某些场合下在某些场合下,隶属度可用模糊统计的方法来确定。隶属度可用模糊统计的方法来确定。模糊统计试验有四个要素模糊统计试验有四个要素:(1)论域论域U,例如年龄的集合例如年龄的集合;(2)U中的一个元素中的一个元素u0,例如例如50岁岁;(3)U中一个边界可变的普通集合中一个边界可变
6、的普通集合 A*,例如例如“年老年老”,A*对应一个模糊集及其相应的模糊概念对应一个模糊集及其相应的模糊概念 a;(4)条件条件s,它对应按概念它对应按概念a所进行的划分所进行的划分(hu fn)过程的全部主、过程的全部主、客观因素客观因素,制约着制约着A*边界的改变边界的改变,例如不同试验者对例如不同试验者对“年老年老”的理解不一样。的理解不一样。第11页/共106页第十二页,共106页。模糊性产生的根本原因就是,条件s对按概念a所作的划分引起A*的变异,导致(dozh)u0对A*的隶属关系不确定,即A*可能覆盖了u0,也可能不覆盖u0。例如,有的试验者认为50岁是“年老”,但有的试验者认为
7、不是。模糊统计试验要求在每一次试验下,对u0是否属于A*作一个确切的判断。经过 n 次试验以后,可计算出u0对的隶属频率:第12页/共106页第十三页,共106页。u0对的隶属(lsh)频率=(8-4)一般(ybn)地,随着n的增大,隶属频率表现出稳定性。u0对的隶属度定义为(8-5)得到统计结果后,可选用某种分布函数进行拟合,适当调整参数(cnsh)就可以得到隶属函数的数学表达式。第13页/共106页第十四页,共106页。2.模糊分布模糊分布(fnb)在许多实际应用中在许多实际应用中,一般以实数集一般以实数集R作为论域。作为论域。实数集实数集R上模糊集合的隶属函数称为模糊分布上模糊集合的隶属
8、函数称为模糊分布(fnb),记为记为F分布分布(fnb)。在实际应用中在实际应用中,可根据具体问题的特点选择相应的可根据具体问题的特点选择相应的 F分布分布(fnb)。也可以通过统计也可以通过统计,给出隶属度的大致曲线给出隶属度的大致曲线,将它与将它与F分布分布(fnb)比较比较,选择相似的一种选择相似的一种,再根据实验确定符合实际的参数。再根据实验确定符合实际的参数。这里给出常用的几种这里给出常用的几种 F分布分布(fnb)。第14页/共106页第十五页,共106页。1)矩形分布(fnb)(1)偏小型(见图8-3(a):(2)偏大型(dxng)(见图8-3(b):第15页/共106页第十六页
9、,共106页。(3)中间(zhngjin)型(图8-3(c)第16页/共106页第十七页,共106页。图 8-3矩形分布(fnb)(a)偏小型;(b)偏大型;(c)中间型第17页/共106页第十八页,共106页。2)梯形分布(fnb)(1)偏小型(见图8-4(a):第18页/共106页第十九页,共106页。(2)偏大型(dxng)(见图8-4(b):第19页/共106页第二十页,共106页。(3)中间(zhngjin)型(见图8-4(c):第20页/共106页第二十一页,共106页。图8-4 梯形分布(fnb)(a)偏小型;(b)偏大型;(c)中间型第21页/共106页第二十二页,共106页。
10、3)抛物形分布(fnb)(1)偏小型(图8-5(a)第22页/共106页第二十三页,共106页。(2)偏大型(dxng)(图8-5(b)第23页/共106页第二十四页,共106页。(3)中间(zhngjin)型(图8-5(c)第24页/共106页第二十五页,共106页。图8-5 抛物形分布(a)偏小型;(b)偏大型(dxng);(c)中间型第25页/共106页第二十六页,共106页。4)正态分布(1)偏小型(xioxng)(图8-6(a)第26页/共106页第二十七页,共106页。(2)偏大型(dxng)(图8-6(b)(3)中间(zhngjin)型(图8-6(c))第27页/共106页第二十
11、八页,共106页。图8-6 正态分布(a)偏小型;(b)偏大型(dxng);(c)中间型第28页/共106页第二十九页,共106页。5)柯西分布(fnb)(1)偏小型(图8-7(a)第29页/共106页第三十页,共106页。(2)偏大型(dxng)(图8-7(b)(3)中间(zhngjin)型(图8-7(c))第30页/共106页第三十一页,共106页。图8-7 柯西分布(fnb)(a)偏小型;(b)偏大型;(c)中间型第31页/共106页第三十二页,共106页。6)岭形分布(fnb)(1)偏小型(图8-8(a)第32页/共106页第三十三页,共106页。(2)偏大型(dxng)(图8-8(b
12、)第33页/共106页第三十四页,共106页。(3)中间(zhngjin)型(图8-8(c))第34页/共106页第三十五页,共106页。图8-8 岭形分布(a)偏小型;(b)偏大型(dxng);(c)中间型 第35页/共106页第三十六页,共106页。8.1.3模糊子集的运算模糊子集的运算1.基本运算基本运算 两个两个(lin)模糊子集之间的运算是通过对两个模糊子集之间的运算是通过对两个(lin)隶属度作逐点的运算来实现的。隶属度作逐点的运算来实现的。(1)相等相等:设和为论域设和为论域U上的两个上的两个(lin)模模糊子集糊子集,若若,有有,则称和则称和相等相等,即即(8-6)第36页/共
13、106页第三十七页,共106页。(2)包含:设和为论域U上的两个(lin)模糊子集,若,有 ,则包含,即(8-7)(3)空集(kn j):设为论域上的模糊子集,若,有,则称为空集(kn j),记为,即(8-8)第37页/共106页第三十八页,共106页。(4)补集:设 和 为论域上的两个(lin)模糊子集,若 ,有(8-9)则称 为 的补集。(5)全集:设 为论域U上的模糊(m hu)子集,若 ,有 ,则称 为全集,记为,即(8-10)第38页/共106页第三十九页,共106页。(6)并集:设,都为论域上的模糊(m hu)子集,若,有 ,则称 为 与 的并集,即(8-11)(7)交集(jioj
14、):设 ,都为论域U上的模糊子集,若,有 ,则称 为 与 的交集(jioj),即(8-12)第39页/共106页第四十页,共106页。2.模糊子集运算的基本性质模糊子集运算的基本性质 一般地一般地,除互补律以外除互补律以外,在普通集合在普通集合(jh)中成立的各种基本性质对于模糊集合中成立的各种基本性质对于模糊集合(jh)也都成立。也都成立。模糊子集运算的基本性质如下模糊子集运算的基本性质如下:(1)自反律自反律:(8-13)(2)反对(fndu)称律(8-14)第40页/共106页第四十一页,共106页。(8-16)(3)传递(chund)律(8-15)(4)幂等律(5)交换律(8-17)第
15、41页/共106页第四十二页,共106页。(8-18)(6)结合律(7)吸收(xshu)律(8-19)(8)分配律:(8-20)第42页/共106页第四十三页,共106页。(8-21)(9)双重(shungchng)否定律(10)对偶(du u)律(德摩根定律)(8-22)(11)定常律;(8-23)第43页/共106页第四十四页,共106页。(12)一般(ybn)地,互补律不成立(8-24)3.模糊模糊(m hu)集合与普通集合的相互转化集合与普通集合的相互转化截集概念和分解定理是普通集合与模糊截集概念和分解定理是普通集合与模糊(m hu)集合之间的联系纽带集合之间的联系纽带,可以把模糊可以
16、把模糊(m hu)集合论的问题转化为普通集合论的问题。集合论的问题转化为普通集合论的问题。与之对应的是与之对应的是,扩张原则把普通集合论的方法扩展到模糊扩张原则把普通集合论的方法扩展到模糊(m hu)集合论中去。集合论中去。扩张原则是扩张原则是Zedah于于1975 年提出的年提出的,可作为公理来使用可作为公理来使用,但实质上是一个定义。但实质上是一个定义。第44页/共106页第四十五页,共106页。定义(dngy)8.2对于给定的模糊集合,对任意0,1,称普通集合(8-2)为 的截集。A是 的隶属(lsh)度达到或超过的元素的集合。不难证明,截集A满足如下三个性质:(8-26)(8-27)(
17、8-28)第45页/共106页第四十六页,共106页。此外,容易验证,模糊数 的截集为实数轴的一个闭区间,即A=a,b。定义8.3设,称A1为 的核;称为 的支集;称SuppA1为 的边界。若模糊子集(z j)为正规模糊集,则的核是非空的,反之亦然。Supp 第46页/共106页第四十七页,共106页。定理8.1 (分解定理)设为论域U上的一个模糊(m hu)子集,A是的截集,0,1,则可以分解为(8-29)其中,模糊(m hu)子集A称为与A的“乘积”,其隶属函数为(8-30)第47页/共106页第四十八页,共106页。8.2 模模 糊糊 关关 系系8.2.1模糊关系模糊关系(gun x)的
18、定义的定义设设U、V是两个论域是两个论域,记记(8-33)UV称为(chn wi)U与V的笛卡尔乘积集。第48页/共106页第四十九页,共106页。由式(8-33)可以看出,笛卡尔乘积集是两个集合元素间的无约束搭配。如果对搭配加以约束,便形成了一种特殊关系,相应的元素对构成(guchng)笛卡尔乘积集的一个子集,该子集体现了相互之间的这种关系。因此,在普通集合论中,U到V的一个关系被定义为UV的一个子集R。相应地,模糊关系就是论域UV上的一个模糊子集。第49页/共106页第五十页,共106页。定义8.5称论域UV上的一个模糊子集为从U到V的一个模糊关系(gun x),记作 。模糊关系(gun
19、x)的隶属函数为(8-34)当论域U、V都是有限集合时,模糊(m hu)关系 可以用一个矩阵R来表示,即(8-35)第50页/共106页第五十一页,共106页。其中(qzhng),()。矩阵(j zhn)R称作模糊矩阵(j zhn)。若()(8-36)则矩阵(j zhn)R退化为布尔矩阵(j zhn)。布尔矩阵(j zhn)表示的是一种普通关系,因而普通关系是模糊关系的特例。第51页/共106页第五十二页,共106页。模糊关系的建立主要包括如下两个(lin)步骤:(1)数据规范。把各对象的数据规范化,一般把数据规范到闭区间0,1。(2)计算对象i与j之间具有某种关系 的程度rij(一般是对象i
20、与j之间的相似程度),其中,1in,1jm,n和m为对象个数,从而确定模糊关系 所对应的模糊矩阵R。第52页/共106页第五十三页,共106页。8.2.2模糊关系与模糊矩阵的运算模糊关系与模糊矩阵的运算下面定义模糊关系与模糊矩阵的运算下面定义模糊关系与模糊矩阵的运算,它们它们(t men)之间是等价的。之间是等价的。1.并、并、交、交、补、补、相等和包含运算相等和包含运算定义定义8.6用用Fnm表示表示n行行m列模糊矩阵的全体列模糊矩阵的全体,对任意对任意R=(rij),S=(sij)Fnm,定义定义(8-37)(8-38)(8-39)第53页/共106页第五十四页,共106页。2.截矩阵截矩
21、阵(j zhn)定义定义8.7对任意对任意0,1,记记R=(ij),其中其中称R为R的截矩阵,它所对应的关系(gun x)称为 的截关系(gun x)。第54页/共106页第五十五页,共106页。8.3 模糊模式识别基本模糊模式识别基本(jbn)思想思想8.3.1特征的模糊化特征的模糊化特征的模糊化是指根据一定的模糊化规则把普特征的模糊化是指根据一定的模糊化规则把普通意义下的一个或几个特征变量变成多个模糊变量通意义下的一个或几个特征变量变成多个模糊变量,用来表达用来表达(biod)原始特征的某一局部特性。原始特征的某一局部特性。其中其中,模糊化规则通常是根据具体应用领域的专门知识人模糊化规则通
22、常是根据具体应用领域的专门知识人为确定或通过试算确定的为确定或通过试算确定的;当论域为实数域时当论域为实数域时,模糊模糊变量一般为模糊数。变量一般为模糊数。第55页/共106页第五十六页,共106页。例如,在统计模式识别中,人的身高是一个数字化的特征。在模糊模式识别中,根据需要,可以把身高特征分为“偏矮”、“中等”和“偏高”三个模糊特征。每个模糊特征是一个连续变量,分别表示身高属于偏矮、中等和偏高的程度,而不是身高的具体数值。这种表示方法通常(tngchng)称为1ofN编码(N分之一编码)。特征的模糊化将一个确定的点x=(x1,x2,xn)TU=U1U2Un 转换成一个模糊集 ,其中,U为论
23、域。主要有两种映射方法:第56页/共106页第五十七页,共106页。(1)单值模糊产生器。若集合 对于支撑集x为模糊单值,则对于某一点x=x,有 ,而对其余所有xx,有 。(2)非单值模糊产生器。当x=x时,有;当x逐渐远离x时,从1开始衰减。模糊特征能够更好地反映问题的本质,简化分类器的设计和提高分类器的性能,特别是,若对特征与分类问题之间的关系有一定的先验知识,则这种方法一般(ybn)能取得较好的结果。第57页/共106页第五十八页,共106页。8.3.2结果的模糊化结果的模糊化在普通模式识别中在普通模式识别中,分类就是把样本空间分类就是把样本空间(或样本集或样本集)分成分成若干个子集。若
24、干个子集。在模糊模式识别中在模糊模式识别中,用模糊子集代替确定子集用模糊子集代替确定子集,从而得到模糊的分类结果从而得到模糊的分类结果,即分类结果的模糊化即分类结果的模糊化,其中其中,一个一个样本以不同的程度属于各个样本以不同的程度属于各个(gg)类别类别,而不再属于某个确而不再属于某个确定的类别。定的类别。第58页/共106页第五十九页,共106页。与确定的分类结果(ji gu)相比,模糊化的分类结果(ji gu)主要有两个显著的优点:(1)可以反映出分类过程中的不确定性,有利于用户根据结果(ji gu)进行决策。(2)模糊化的分类结果(ji gu)比明确的分类结果(ji gu)中包含更多的
25、信息,有利于进一步决策。第59页/共106页第六十页,共106页。8.3.3硬分类和模糊分类硬分类和模糊分类1.硬分类硬分类在硬分类中在硬分类中,把样本集把样本集x1,x2,xN分成分成m类类,每一个每一个xk必须完全属于某一类必须完全属于某一类,同时同时,每一类至少包含每一类至少包含(bohn)一一个样本。个样本。这种分类结果可以用一个这种分类结果可以用一个mN阶矩阵阶矩阵V来表示来表示,V中元素中元素vik表示样本表示样本xk是否属于第是否属于第i类类Ai(i=1,2,m,k=1,2,N),即即第60页/共106页第六十一页,共106页。矩阵V具有如下(rxi)性质:(1)vik0,1;(
26、2);(3)。【例【例 8.3】已知样本集为】已知样本集为 x1,x2,x3,x4,x5。若分类若分类(fn li)结果为结果为x1,x5,x3,x4,x2,则分类则分类(fn li)矩阵矩阵V为为第61页/共106页第六十二页,共106页。其中,矩阵的列代表样本,行代表类别(libi)。若分类矩阵为 则分类(fn li)结果为x1,x2,x3,x5,x4。第62页/共106页第六十三页,共106页。2.模糊分类模糊分类 当硬分类矩阵中元素的取值位于当硬分类矩阵中元素的取值位于 0,1区间区间(q jin),即硬分类矩阵即硬分类矩阵V变成模糊分类矩阵变成模糊分类矩阵,则硬分类变成模糊分类。则硬
27、分类变成模糊分类。模糊分类矩阵具有如下性质模糊分类矩阵具有如下性质:(1)vik0,1;(2);(3)。第63页/共106页第六十四页,共106页。【例 8.4】设样本(yngbn)集为x1,x2,x3,则 都是模糊分类(fn li)矩阵。第64页/共106页第六十五页,共106页。事实上,每一个模糊分类矩阵都可以用若干个硬分类矩阵的加权平均(pngjn)来表示。例如,第65页/共106页第六十六页,共106页。8.3.4模式分类的最大隶属原则与择近原则模式分类的最大隶属原则与择近原则模糊模式识别中主要有两种判决准则模糊模式识别中主要有两种判决准则:最大隶属原则最大隶属原则和择近原则。和择近原
28、则。其中其中,前者主要应用于个体的识别前者主要应用于个体的识别,后者主后者主要应用于群体模型的识别。要应用于群体模型的识别。1.最大隶属原则最大隶属原则普通模式识别中的模式是明确、普通模式识别中的模式是明确、清晰和肯定的清晰和肯定的,例如例如印刷体汉字识别中印刷体汉字识别中,模式就是印刷体汉字。模式就是印刷体汉字。但是但是,在很多在很多实际问题实际问题(wnt)中中,模式本身就具有一定的模糊性模式本身就具有一定的模糊性,如如“矮矮个子个子”、“中等个子中等个子”和和“高个子高个子”。对于这类问题对于这类问题(wnt),可以根据最大隶属原则来进行分类。可以根据最大隶属原则来进行分类。第66页/共
29、106页第六十七页,共106页。模式分类的最大隶属原则就是直接利用样本的隶属度,将其归入对应于最大隶属度的类别中。设是论域U上的m个模糊子集,其隶属函数(hnsh)分别为,对任一给定的u0U,如果 那么,u0隶属于。这个原则(yunz)称为最大隶属原则(yunz)。第67页/共106页第六十八页,共106页。【例【例 8.5】根据人的年龄】根据人的年龄,把人分为把人分为(fn wi)年轻、年轻、中年、中年、老年三类老年三类,分别对应三个模糊子集。分别对应三个模糊子集。考虑论域考虑论域U=(0,100,的隶属函数分别为的隶属函数分别为(如图如图8-9所示所示):第68页/共106页第六十九页,共
30、106页。张三今年40岁,由上述隶属函数,有 ,根据最大隶属原则,他是中年人。隶属原则的思想简单,其效果依赖于模式类隶属函数的建立。此外,隶属原则主要适用于个体(gt)的识别。第69页/共106页第七十页,共106页。图8-9 例8.5中隶属(lsh)函数示例图第70页/共106页第七十一页,共106页。2.择近原则择近原则如果模式本身是如果模式本身是 U上的一个模糊子集上的一个模糊子集,识别的对象也是论域识别的对象也是论域 U上的一个模糊子集上的一个模糊子集,而不是某一特定的单个元素而不是某一特定的单个元素,则可以利用则可以利用(lyng)模糊子集之间的接近程度模糊子集之间的接近程度(即贴近
31、度即贴近度)进行模式分类。进行模式分类。定义定义8.17 设设 ,若映射,若映射:第71页/共106页第七十二页,共106页。满足条件:(1);(2);(3)若或,则则称为模糊(m hu)子集与的贴近度;称为F(U)上的贴近(tijn)函数。第72页/共106页第七十三页,共106页。目前,针对不同的问题,已经提出了多种贴近度的计算方法,主要的几种如下:1)距离(jl)贴近度(1)海明距离(jl)贴近度。设为有限论域,则之间的海明距离(jl)贴近度为,(8-45)第73页/共106页第七十四页,共106页。进一步,当U为实数(shsh)域上的闭区间a,b时,则有(8-46)(2)欧几里德距离。
32、设 ,U=u1,u2,un为有限(yuxin)论域,则之间的欧几里德距离贴近度为(8-47)第74页/共106页第七十五页,共106页。进一步,当U为实数(shsh)域上的闭区间a,b时,则有(8-48)(3)明可夫斯基距离(jl)。设,U=u1,u2,un为有限论域,则之间的明可夫斯基距离(jl)贴近度为(8-49)第75页/共106页第七十六页,共106页。进一步,当U为实数(shsh)域上的闭区间a,b时,则有(8-50)2)几何贴近(tijn)度设、是测度空间 上的可测函数,则 之间的几何贴近(tijn)度为:第76页/共106页第七十七页,共106页。(8-51)(8-52)其中,式
33、(8-51)和式(8-52)的积分为勒贝格积分。进一步,若U为实数(shsh)域,被积函数为黎曼可积,且广义积分收敛,则之间的几何贴近度为 第77页/共106页第七十八页,共106页。(8-53)(8-54)第78页/共106页第七十九页,共106页。若U=u1,u2,un为有限论域,之间的几何(j h)贴近度为(8-55)3)格贴近(tijn)度设 ,之间的格贴近(tijn)度为 第79页/共106页第八十页,共106页。(8-56)其中(qzhng),为内积为外积(wi j)。第80页/共106页第八十一页,共106页。【例 8.6】根据茶叶的条索、色泽、净度、汤色、香气和滋味,把茶叶分成
34、(fn chn)“特等”,“优等”,“良等”,“中等”和“差等”五种型号,它们对应于论域U上的模糊子集:“特等(tdng)”:=(0.50.40.30.60.50.4)“优等”:=(0.30.20.20.10.20.2)“良等”:=(0.20.20.20.10.10.2)“中等”:=(0.00.10.20.10.10.1)“差等”:=(0.00.10.10.10.10.1)其中,论域U=条索,色泽,净度,汤色,香气,滋味。第81页/共106页第八十二页,共106页。待识别的茶叶(chy)模型对应于U上的模糊子集:=由格贴近(tijn)度计算式,可得:;根据择近原则(yunz),待识别的茶叶模型
35、为“特等”。第82页/共106页第八十三页,共106页。8.4 模糊聚类分析模糊聚类分析8.4.1 模糊等价关系法模糊等价关系法可以证明可以证明,模糊矩阵模糊矩阵R Fnn是等价矩阵是等价矩阵,当且仅当对于任意当且仅当对于任意 0,1,其截矩阵其截矩阵R都都是等价的布尔矩阵。是等价的布尔矩阵。因此因此,若若 为模糊等价关系为模糊等价关系,则对于给定的则对于给定的 0,1,便可得到相应的普通等价关系便可得到相应的普通等价关系R,从而得到一个从而得到一个水平的分类。水平的分类。进一步进一步,若若01,则截矩阵则截矩阵R所分出的每一所分出的每一类是截矩阵类是截矩阵R所分出的某一类的子类所分出的某一类
36、的子类,即即R的的分类法是分类法是R分类法的分类法的“加细加细”。当当从从1逐渐降逐渐降为为0时时,分类结果逐步归并分类结果逐步归并(gubng)(逐渐变粗逐渐变粗),形成一个动态聚类图。形成一个动态聚类图。第83页/共106页第八十四页,共106页。【例【例 8.7】设论域】设论域U=x1,x2,x3,x4,x5,模糊模糊(m hu)矩阵为矩阵为 R具有自反性、具有自反性、对称性和传递性对称性和传递性,即即R对应一个模糊等价关系对应一个模糊等价关系 。现考察不同现考察不同(b tn)水平的分类结果。水平的分类结果。第84页/共106页第八十五页,共106页。(1)若0.621,则截矩阵(j
37、zhn)为 此时,得到“最细”的分类:x1,x2,x3,x4,x5,即每个元素(yun s)自成一类。第85页/共106页第八十六页,共106页。(2)若0.480.62,则截矩阵(j zhn)为 此时,得到(d do)四类:x1,x3,x2,x4,x5。第86页/共106页第八十七页,共106页。(3)若0.470.48,则截矩阵(j zhn)为 此时,得到(d do)三类:x1,x2,x3,x4,x5。第87页/共106页第八十八页,共106页。(4)若0.41k,有。此时,是一个模糊等价关系,对应的模糊矩阵是模糊等价矩阵。第90页/共106页第九十一页,共106页。【例【例 8.8】设论
38、域】设论域U=x1,x2,x3,x4,x5,模糊模糊(m hu)矩阵为矩阵为容易(rngy)验证,模糊矩阵R具有自反性与对称性,但不满足传递性,因为 第91页/共106页第九十二页,共106页。因此(ync),R仅是模糊相似矩阵,对应的模糊关系仅是模糊相似关系。类似地,可以求出R4与R8,并且R4=R8,因此(ync),R4对应的模糊关系就是模糊等价关系。第92页/共106页第九十三页,共106页。8.4.3模糊模糊K均值算法均值算法在在K均值算法中均值算法中,把把N个样本个样本(yngbn)x1,x2,xN划分成划分成K个子类个子类G1,G2,GK,使得所有样本使得所有样本(yngbn)到聚
39、类中心的距离平方和最小到聚类中心的距离平方和最小,也就是使下式也就是使下式的准则函数的准则函数(8-58)第93页/共106页第九十四页,共106页。达到最小。式(8-58)中:mj为第j个子类Gj的聚类中心;xi表示分到Gj的所有(suyu)样本,j=1,2,K。模糊K均值算法就是,在K均值算法中,把硬分类变为模糊分类。设j(xi)是第i个样本xi属于第j类Gj的隶属度,利用隶属度定义的聚类损失函数为(8-59)第94页/共106页第九十五页,共106页。其中,b1是一个可以控制聚类结果的模糊程度的常数。进一步,要求一个样本属于各个(gg)聚类的隶属度之和为1,即(8-60)利用拉格朗日乘数
40、法来求解在条件(tiojin)式(8-60)约束下式(8-59)的极小值。令目标函数为 第95页/共106页第九十六页,共106页。(8-61)其中(qzhng),i(i=1,2,N)为拉格朗日乘子。分别求L对mi、i和j(xi)的梯度(或偏导),并置为0,可得必要条件:(8-62)第96页/共106页第九十七页,共106页。(8-62)模糊K均值算法采用迭代方法求解式(8-62)和式(8-63),其步骤如下:(1)设定聚类数目(shm)K、参数b和一个适当的小数0,通常取1b5。(2)设置初始模糊分类矩阵U(0),令s=0。(3)根据式(8-62)计算U(s)的聚类中心m(s)j,j=1,2
41、,K。第97页/共106页第九十八页,共106页。(4)按下面的方法(fngf)更新U(s)为U(s+1):计算Ii和,其中(i=1,2,N)计算(j sun)xi的新隶属度。如果Ii为空集,则按式(8-63)计算(j sun)隶属度;否则,第98页/共106页第九十九页,共106页。并取。(5)选取一个适当的矩阵范数,如果U(s)U(s+1),则停止迭代,否则s=s+1,返回(3)。当模糊K均值算法收敛时,就得到了各类的聚类中心和各个样本属于各类的隶属(lsh)度,也就完成了模糊聚类。进一步,可以将模糊聚类结果去模糊化,把模糊聚类变为确定性分类。第99页/共106页第一百页,共106页。习习
42、 题题8-1设有西瓜(xgu)的论域U=u1,u2,u3,u4,u5,有模糊子集“大”()和“熟”()F(U)。试求。第100页/共106页第一百零一页,共106页。8-2设模糊(m hu)关系,相应(xingyng)的模糊(m hu)矩阵为,计算:(1);(2);(3)。第101页/共106页第一百零二页,共106页。8-3计算下面模糊(m hu)矩阵对应的模糊(m hu)关系的传递闭包 8-4 设F集第102页/共106页第一百零三页,共106页。试分别(fnbi)计算格贴近度与海明贴近度。8-5设F集第103页/共106页第一百零四页,共106页。试用格贴近度判断、与哪个(n ge)最接近。8-6在聚类分析中,被分类对象集U=u1,u2,u3,u4,u5,针对问题(wnt)经大量工作后得到模糊关系对应的模糊矩阵 第104页/共106页第一百零五页,共106页。试按不同程度(=1,0.8,0.6,0.5,0.4)采用传递闭包法对5个对象进行(jnxng)分类。第105页/共106页第一百零六页,共106页。