《模煳数学教案t课件(3)市公开课一等奖百校联赛特等奖课件.pptx》由会员分享,可在线阅读,更多相关《模煳数学教案t课件(3)市公开课一等奖百校联赛特等奖课件.pptx(37页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第第 3 章章含糊模型识别含糊模型识别第1页3.1含糊模型识别含糊模型识别模型识别模型识别 已知某类事物若干标准模型,现有这类事物已知某类事物若干标准模型,现有这类事物中一个详细对象,问把它归到哪一模型,这就是中一个详细对象,问把它归到哪一模型,这就是模型识别模型识别.模型识别在实际问题中是普遍存在模型识别在实际问题中是普遍存在.比如,比如,学生到野外采集到一个植物标本,要识别它属于学生到野外采集到一个植物标本,要识别它属于哪一纲哪一目;投递员哪一纲哪一目;投递员(或分拣机或分拣机)在分拣信件时在分拣信件时要识别邮政编码等等,这些都是模型识别要识别邮政编码等等,这些都是模型识别.含糊模型识别含
2、糊模型识别 所谓含糊模型识别所谓含糊模型识别,是指在模型识别中是指在模型识别中,模型模型是含糊是含糊.也就是说也就是说,标准模型库中提供模型是含糊标准模型库中提供模型是含糊.第2页模型识别模型识别原理原理 为了能识别待判断对象为了能识别待判断对象x=(x1,x2,xn)T是是属于已知类属于已知类A1,A2,Am中哪一类?中哪一类?事先必须要有一个普通规则事先必须要有一个普通规则,一旦知道了一旦知道了x值值,便能依据这个规则马上作出判断便能依据这个规则马上作出判断,称这么一个规称这么一个规则为则为判别规则判别规则.判别规则往往经过某个函数来表示判别规则往往经过某个函数来表示,我们把我们把它称为它
3、称为判别函数判别函数,记作记作W(i;x).一旦知道了一旦知道了判别函数并确定了判别函数并确定了判别规则,最判别规则,最好将已知类别对象代入检验,这一过程称为好将已知类别对象代入检验,这一过程称为回代回代检验检验,方便检验你,方便检验你判别函数和判别函数和判别规则是否正确判别规则是否正确.第3页3.2 最大隶属标准最大隶属标准含糊向量内积与外积含糊向量内积与外积 定义定义 称向量称向量a=(a1,a2,an)是含糊向量是含糊向量,其中其中0ai1.若若ai 只取只取0或或1,则称则称a=(a1,a2,an)是是Boole向量向量.设设 a=(a1,a2,an),b=(b1,b2,bn)都都是含
4、糊向量,则定义是含糊向量,则定义 内积内积:a b=(akbk)|1kn;外积外积:a b=(akbk)|1kn.内积与外积性质内积与外积性质(a b)c=a c b c;(a b)c=a c b c.第4页含糊向量集合族含糊向量集合族 设设A1,A2,An是论域是论域X上上n个含糊子集个含糊子集,称称以含糊集以含糊集A1,A2,An为分量含糊向量为为分量含糊向量为含糊向含糊向量集合族量集合族,记为,记为A=(A1,A2,An).若若X 上上n个含糊子集个含糊子集A1,A2,An隶属函数隶属函数分别为分别为A1(x),A2(x),An(x),则定义含糊向则定义含糊向量集合族量集合族 A=(A1
5、,A2,An)隶属函数为隶属函数为A(x)=A1(x1),A2(x2),An(xn)或者或者A(x)=A1(x1)+A2(x2)+An(xn)/n.其中其中x=(x1,x2,xn)为普通向量为普通向量.第5页最大隶属标准最大隶属标准 最大隶属标准最大隶属标准 设论域设论域X=x1,x2,xn 上有上有m个含糊子集个含糊子集A1,A2,Am(即即m个模型个模型),),组成了一个标准模型库组成了一个标准模型库,若对任一若对任一x0X,有有k1,2,m,使得使得Ak(x0)=A1(x0),A2(x0),Am(x0),则认为则认为x0相对隶属于相对隶属于Ak.最大隶属标准最大隶属标准 设论域设论域X上
6、有一个标准模上有一个标准模型型A,待识别对象有待识别对象有n个:个:x1,x2,xnX,假如假如有某个有某个xk满足满足A(xk)=A(x1),A(x2),A(xn),则应优先录用则应优先录用xk.第6页 例例1 1 在论域在论域X=0,1000,100分数上建立三个表示分数上建立三个表示学习成绩含糊集学习成绩含糊集A=“优优”,”,B=“良良”,”,C=“差差”.”.当当一位同学成绩为一位同学成绩为8888分时分时,这个成绩是属于哪一类这个成绩是属于哪一类?A(88)=0.8第7页B(88)=0.7第8页A(88)=0.8,B(88)=0.7,C(88)=0.依据最大隶属标准依据最大隶属标准
7、,88,88分这个成绩应隶属分这个成绩应隶属于于A,即为即为“优优”.”.例例2 论论域域 X=x1(71),x2(74),x3(78)表表示三个学生成绩示三个学生成绩,那一位学生成绩最差?那一位学生成绩最差?C(71)=0.9,C(74)=0.6,C(78)=0.2,依据最大隶属标准依据最大隶属标准,x1(71)最差最差.第9页例例3 3 细胞染色体形状含糊识别细胞染色体形状含糊识别 细胞染色体形状含糊识别就是几何图形含糊细胞染色体形状含糊识别就是几何图形含糊识别识别,而几何图形经常化为若干个三角图形而几何图形经常化为若干个三角图形,故设故设论域为三角形全体论域为三角形全体.即即X=(A,B
8、,C)|A+B+C=180,ABC 标准模型库标准模型库=E(正三角形正三角形),),R(直角三角形直角三角形),),I(等腰三角形等腰三角形),),IR(等腰直角三角形等腰直角三角形),),T(任意三任意三角形角形).).某人在试验中观察到一染色体几何形状,测某人在试验中观察到一染色体几何形状,测得其三个内角分别为得其三个内角分别为94,50,36,94,50,36,即待识别对象为即待识别对象为x0=(94,50,36).=(94,50,36).问问x0应隶属于哪一个三角形?应隶属于哪一个三角形?第10页先建立标准模型库中先建立标准模型库中各种三角形隶属函数各种三角形隶属函数.直角三角形隶属
9、函数直角三角形隶属函数R(A,B,C)应满足以下约应满足以下约束条件:束条件:(1)(1)当当A=90时时,R(A,B,C)=1;(2)(2)当当A=180时时,R(A,B,C)=0;(3)(3)0R(A,B,C)1.所以,不妨定义所以,不妨定义R(A,B,C)=1-|A-90|/90.则则R(x0)=0.955.或者或者其中其中 p=|A 90|则则R(x0)=0.54.第11页 正三角形隶属函数正三角形隶属函数E(A,B,C)应满足以下约束应满足以下约束条件:条件:(1)当当A=B=C=60时时,E(A,B,C)=1;(2)当当A=180,B=C=0时时,E(A,B,C)=0;(3)0E(
10、A,B,C)1.所以,不妨定义所以,不妨定义E(A,B,C)=1 (A C)/180.则则E(x0)=0.677.或者或者其中其中 p=A C 则则E(x0)=0.02.第12页 等腰三角形隶属函数等腰三角形隶属函数I(A,B,C)应满足以下约束应满足以下约束条件:条件:(1)(1)当当A=B 或者或者 B=C时时,I(A,B,C)=1;(2)(2)当当A=180,B=60,C=0时时,I(A,B,C)=0;(3)(3)0I(A,B,C)1.所以,不妨定义所以,不妨定义I(A,B,C)=1 (A B)(B C)/60.则则I(x0)=0.766.或者或者 p=(A B)(B C)则则I(x0)
11、=0.10.第13页等腰直角三角形隶属函数等腰直角三角形隶属函数(IR)(A,B,C)=I(A,B,C)R(A,B,C);(IR)(x0)=0.7660.955=0.766.任意三角形隶属函数任意三角形隶属函数T(A,B,C)=IcRcEc=(IRE)c.T(x0)=(0.7660.9550.677)c=(0.955)c=0.045.经过以上计算经过以上计算,R(x0)=0.955最大最大,所以所以x0应隶应隶属于直角三角形属于直角三角形.或者或者(IR)(x0)=0.10;T(x0)=(0.54)c=0.46.依然是依然是R(x0)=0.54最大最大,所以所以x0应隶属于直角三角应隶属于直角
12、三角形形.第14页例例4 4 大学生体质水平含糊识别大学生体质水平含糊识别.陈蓓菲等人在福建农学院对陈蓓菲等人在福建农学院对240240名男生体质名男生体质水平按中国学生体质健康调查研究手册上要水平按中国学生体质健康调查研究手册上要求求,从从1818项体测指标中选出了反应体质水平项体测指标中选出了反应体质水平4 4个主个主要指标要指标(身高、体重、胸围、肺活量身高、体重、胸围、肺活量),),依据聚类依据聚类分析法分析法,将将240240名男生分成名男生分成5 5类:类:A1(体质差体质差),),A2(体质中下体质中下),),A3(体质中体质中),),A4(体质良体质良),),A5 (体质优体质
13、优),),作为论域作为论域U(大学生大学生)上一个标准模型库上一个标准模型库,然后用然后用最大隶属标准最大隶属标准,去识别一个详细学生体质去识别一个详细学生体质.5.5类标类标准体质准体质4 4个主要指标观察数据以下表所表示个主要指标观察数据以下表所表示.第15页身高身高(cm)体重体重(kg)胸围胸围(cm)肺活量肺活量(cm3)A1158.43.047.98.484.22.43380184A2163.44.850.08.689.06.23866800A3166.93.655.39.488.37.04128526A4172.64.657.78.289.26.44349402A5178.44.
14、261.98.690.98.04536756 现有一名待识别大学生现有一名待识别大学生x=x1,x2,x3,x4 =175,55.1,86,3900,他应属于哪种类型?,他应属于哪种类型?第16页阈值标准阈值标准 设论域设论域X=x1,x2,xn 上有上有m个含糊子个含糊子集集A1,A2,Am(即即m个模型个模型),),组成了一个标准组成了一个标准模型库模型库,若对任一若对任一x0X,取定水平取定水平 0,1.若存在若存在 i1,i2,ik,使使Aij(x0)(j=1,2,k),则判决为:则判决为:x0相对隶属于相对隶属于 若若Ak(x0)|k=1,2,m,则判决为:则判决为:不能识别不能识别
15、,应该找原因另作分析应该找原因另作分析.该方法也适合用于判别该方法也适合用于判别x0是否隶属于是否隶属于标准模标准模型型Ak.若若Ak(x0),则判决为:则判决为:x0相对隶属于相对隶属于Ak;若若Ak(x0),则判决为:则判决为:x0相对不隶属于相对不隶属于Ak.第17页3.3 择近标准择近标准 设在论域设在论域X=x1,x2,xn上有上有m个含糊子个含糊子集集A1,A2,Am(即即m个模型个模型),),组成了一个标准组成了一个标准模型库模型库.被识别对象被识别对象B也是也是X上一个含糊集上一个含糊集,它与它与标准模型库中那一个模型最贴近?这是第二类含标准模型库中那一个模型最贴近?这是第二类
16、含糊识别问题糊识别问题.先将含糊向量内积与外积概念扩充先将含糊向量内积与外积概念扩充.设设A(x),B(x)是论域是论域X上两个含糊子集隶属函上两个含糊子集隶属函数数,定义定义 内积:内积:A B=A(x)B(x)|xX;外积:外积:AB=A(x)B(x)|xX.第18页内积与外积性质内积与外积性质(1)(1)(A B)c=AcBc;(2)(2)(AB)c=Ac Bc;(3)(3)A Ac 1/2;(4)(4)AAc 1/2.证实证实(1)(1)(A B)c=1-A(x)B(x)|xX =1-A(x)1-B(x)|xX=Ac(x)Bc(x)|xX=AcBc.证实证实(3)(3)A Ac=A(x
17、)1-A(x)|xX 1/2|xX 1/2.第19页 下面我们用下面我们用 (A,B)表示两个含糊集表示两个含糊集A,B之间之间贴近程度贴近程度(简称简称贴近度贴近度),),贴近度贴近度 (A,B)有一些不有一些不一样定义一样定义.0(A,B)=A B+(1-A B)/2 (格贴近度格贴近度)1(A,B)=(A B)(1-A B)择近标准择近标准 设在论域设在论域X=x1,x2,xn上有上有m个含糊子个含糊子集集A1,A2,Am组成了一个标准模型库组成了一个标准模型库,B是待是待识别模型识别模型.若有若有k1,2,m,使得使得 (Ak,B)=(Ai,B)|1im,则称则称B与与Ak最贴近最贴近
18、,或者说把或者说把B归于归于Ak类类.这就是这就是择择近标准近标准.第20页小麦品种含糊识别小麦品种含糊识别(仅对百粒重考虑仅对百粒重考虑)第21页多个特征择近标准多个特征择近标准 设在论域设在论域X=x1,x2,xn上有上有n个含糊子个含糊子集集A1,A2,An组成了一个标准模型库组成了一个标准模型库,每个模每个模型又由个特征来刻划:型又由个特征来刻划:Ai=(Ai1,Ai2,Aim),i=1,2,n,待识别模型待识别模型B=(B1,B2,Bm).先求两个含糊向量集合族贴近度:先求两个含糊向量集合族贴近度:si=(Aij,Bj)|1jm,i=1,2,n,若有若有k1,2,n,使得使得 (Ak
19、,B)=si|1in,则称则称B与与Ak最贴近最贴近,或者说把或者说把B归于归于Ak类类.这就是这就是多个特征择近标准多个特征择近标准.第22页贴近度改进贴近度改进格贴近度不足之处是普通格贴近度不足之处是普通 0(A,A)1.定义定义(公理化定义公理化定义)若若 (A,B)满足满足 (A,A)=1;(A,B)=(B,A);若若ABC,则则 (A,C)(A,B)(B,C).则称则称 (A,B)为为A与与B贴近度贴近度.显然,公理化定义显得自然、合理、直观,防止了格贴近度不足之处,它具有理论价值.但是公理化定义并未提供一个计算贴近度方法,不便于操作.于是,人们一方面尽管以为格贴近度有缺陷,但还是乐
20、意采用易于计算格贴近度来解决一些实际问题;其次,在实际工作中又给出了许多具体定义(P145).第23页离散型离散型连续型连续型第24页离散型离散型连续型连续型第25页离散型离散型连续型连续型第26页 实际上实际上,择近标准关键就是最大隶属标准择近标准关键就是最大隶属标准.如如在小麦品种含糊识别在小麦品种含糊识别(仅对百粒重考虑仅对百粒重考虑)中中,可重可重新定义新定义“早熟早熟”、“矮秆矮秆”、“大粒大粒”、“高肥高肥丰产丰产”、“中肥丰产中肥丰产”隶属函数隶属函数.重新定义重新定义“早熟早熟”隶属函数为隶属函数为重新定义重新定义“矮秆矮秆”隶属函数为隶属函数为第27页蠓分类蠓分类 左图给出了
21、左图给出了9只只Af和和6只只Apf蠓触角长和翼长数蠓触角长和翼长数据据,其中其中“”“”表示表示Apf,“”,“”表示表示Af.依据触角长和依据触角长和翼长来识别一个标本是翼长来识别一个标本是Af还是还是Apf是主要是主要.给给定定一一只只Af族族或或Apf族族蠓蠓,怎怎样样正正确确地地域域分分它它属属于于哪一族?哪一族?将将你你方方法法用用于于触触角角长长和和翼翼长长分分别别 为为(1.24,1.80),(1.28,1.84),(1.40,2.04)三三 个个 标标本本.第28页第29页含糊判别方法含糊判别方法 先将已知蠓重新进行分类先将已知蠓重新进行分类.第30页 当当 =0.919时时
22、,分为分为3 3类类 1,2,3,6,4,5,7,8,9,10,11,12,13,14,15,三类中心向量分别为三类中心向量分别为(1.395,1.770),(),(1.560,2.080),(),(1.227,1.927).).用平移极差变换用平移极差变换将它们分别变为将它们分别变为A1=(0.200,0.637)(Af 蠓蠓),A2=(0.390,1.000)(Af 蠓蠓),A3=(0.000,0.821)(Apf 蠓蠓),再将三只待识别蠓用上述变换分别变为再将三只待识别蠓用上述变换分别变为B1=(0.015,0.672),B2=(0.062,0.719),B3=(0.203,0.953)
23、.第31页采取贴近度采取贴近度 3(A,B)=计算得:计算得:3(A1,B1)=0.89,3(A2,B1)=0.65,3(A3,B1)=0.92.3(A1,B2)=0.89,3(A2,B2)=0.69,3(A3,B2)=0.92.3(A1,B3)=0.84,3(A2,B3)=0.88,3(A3,B3)=0.83.s 依据择近标准及上述计算结果依据择近标准及上述计算结果,第一只待识第一只待识别蠓别蠓(1.24,1.80)属于第三类属于第三类,即即Apf 蠓;第二只蠓;第二只待识别蠓待识别蠓(1.28,1.84)属于第三类属于第三类,即即Apf 蠓;第蠓;第三只待识别蠓三只待识别蠓(1.40,2.
24、04)属于第二类属于第二类,即即Af 蠓蠓.第32页 设设Af是传粉益虫是传粉益虫,Apf是某种疾病载体是某种疾病载体,是是否应修改你分类方法?若需修改否应修改你分类方法?若需修改,为何?为何?第33页DNA序列分类与含糊识别序列分类与含糊识别 网易杯全国大学生数学建模竞赛题:生物学网易杯全国大学生数学建模竞赛题:生物学家发觉家发觉DNA序列是由四种碱基序列是由四种碱基A,T,C,GA,T,C,G按一定次按一定次序排列而成序排列而成,其中既没有其中既没有“断句断句”,”,也没有标点符也没有标点符号号,同时也发觉同时也发觉DNADNA序列一些片段含有一定规律性序列一些片段含有一定规律性和结构和结
25、构.由此人工制造两类序列由此人工制造两类序列(A(A类编号为类编号为1 11010;B B类编号为类编号为111120).20).网址:网址:.现在问题是怎样找出比较满意方法来识别未现在问题是怎样找出比较满意方法来识别未知序列知序列(编号为编号为212140),40),并判断它们那些属于并判断它们那些属于A A类类,那些属于那些属于B B类类,那些既不属于那些既不属于A A类又不属于类又不属于B B类类.第34页(1)(1)已知类别已知类别DNA序列含糊分类序列含糊分类 提取已知类别提取已知类别20个个DNA序列序列A,T,C,GA,T,C,G百分含量百分含量组成以下矩阵:组成以下矩阵:X=(
26、xij)204,其中其中xi1,xi2,xi3,xi4分分别表示第个别表示第个DNA系列中系列中A,T,C,GA,T,C,G百分含量百分含量.采取切采取切比雪夫距离法建立含糊相同矩阵比雪夫距离法建立含糊相同矩阵,然后用传递闭包然后用传递闭包法进行聚类法进行聚类,动态聚类图以下动态聚类图以下.第35页第36页(2)(2)确定最正确分确定最正确分类类将将20个已知个已知DNA序列分成以下序列分成以下3类为最正确:类为最正确:A1 1=1,2,3,5,6,7,8 9,10,=1,2,3,5,6,7,8 9,10,A2 2=4,17,=4,17,A3 3=11,12,13,14,15,16,18,19,20.=11,12,13,14,15,16,18,19,20.建立标准模型库:建立标准模型库:A1,A2,A3.(3)(3)未知未知DNADNA序列含糊识别序列含糊识别 采取格贴近度公式:采取格贴近度公式:0(A,B)=A B+(1-A B)/2,将隶属于将隶属于A1DNADNA序列序列归为归为A A类类,隶属于隶属于A3DNADNA序列序列归归为为B B类类,隶属于隶属于A2DNA序列序列归为非归为非A,BA,B类类.第37页