《数学建模之模糊评价与模糊聚类.pdf》由会员分享,可在线阅读,更多相关《数学建模之模糊评价与模糊聚类.pdf(7页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、 数学建模之模糊评价与模糊聚类 TYYGROUP system office room【TYYUA16H-TYY-TYYYUA8Q8-一、模糊评价 模糊评价法是应用模糊理论和模糊关系合成的原理,通过多个因素对被评 价事物隶属等级状况进行综合性评价的一种方法。运用模糊评价法,通过多因素 或多指标,既对被评价事物的变化区间作出某种划分,又对事物属于各评价等级 的程度作出分析,从而更深入和客观地对被评价事物进行描述。特点:模糊评价法的结果是一个向量,而不是一个数值,即被评价事物的状况是通过被评价事物的等级隶属度来表示。模糊评价法可以是一种多层的评价,即可以先对被评价事物的某一层面进行模糊评价,再将各
2、层面的模糊评价结果进行模糊合成,得出总的模糊评价结果。模糊评价法具有指标或因素的自然可综合性。由于模糊评价法只需确定各指标的等级隶属度,既可用于主观指标,又可用于客观指标,以此而无需专门对指标进行无量纲处理。模糊评价的应用 人事考核中的应用,单位员工的年终评定,昆山公安信息化建设效绩的评估(下载文档),我国商业银行内部控制评价体系研究(下载文档),石化行业业绩评价(下载文档)等。一级模糊综合评判模型的建立步骤 确定因素集及评语集 确定被评价对象的因素集 U,12=,nUu uu,评语集12,mVv vv;构造模糊关系矩阵 R,进行单因素评判。用ijr表示 U 中的因素iu对应于 V 中等级jv
3、的隶属关系,则有 确定各因素的权重 用ia表示第 i 个因素的权重,11niia,则评价因素权向量 A 为 12,nAa aa。综合评判 由模糊关系矩阵 R 得到一个模糊变换为 则评判的综合结果为 11121212221212,mmnnnnmrrrrrrBA Ra aarrr。多层次模糊综合评判模型的建立步骤 确定被评价对象的因素集 U,12=,nUu uu,评语集12,mVv vv;将U按照某种属性划分成 s 个子因素集,即12,sU UU。其中12,1,2,iiiiinUUUUis并且满足以下关系:分别对每个因素集iU做综合评价。确定iU中各个因素相对于 V 的权重12,iiiiinAaa
4、a,用iR表示单因素评判矩阵,则一级评价向量为 将各个iU看成一个因素,记该因素为12,sKu uu,得到 K 的单因素评价矩阵为 按照iU对 U 的重要程度,确定权重12,sAa aa,则得二级评价向量为 若(1,2,)iU is包含的因素较多,可将iU多次划分,得到三级,四级评价模型等。例题:向位专家就科研课题进行调查,通过统计调查数据,形成科研课题 A 评价数据如下表:科研课题 A 的评价数据 模型的建立 确定因素集及评语集 令指标集为F,指标由 5 个指标组成,即125(,)Ffff,1f表示立题必要性,2f表示技术先进性,。3f表示实施可行性,。4f表示经济合理性,5f表示社会效益。
5、令评语集为 V,125(,)Vv vv,123,=vvv“一级”“二级”“三级”,3=v“四级”,5=v“五级”。由加权平均原则确定。构造模糊关系矩阵 R,12345=(r r r r r)R,进行单因素评判。确定各因素的权重 令权重集为12345=(w)Ww w w w ,1w=,2w=,3w=,4w=,5w=。综合评判 其中 是合成的算子为向量或矩阵间的“乘”运算。模型的求解 确定因素集及评语集 根据加权平均原则来确定评语。对各评语赋值,令“一级”、“二级”、“三级”、“四级”、“五级”分别为分、分、分、分、分,令 V=。构造模糊关系矩阵 R,12345=(r r r r r)R,进行单因
6、素评判。从表可知,在立题必要性的调查中有 6 位专家认为属于“二级”,有 3 位专家认为属于“三级”;在技术先进性的调查中有 5 位专家认为属于“一级”,有 3位专家认为属于“二级”,有 1 位专家认为属于“三级”;在实施可行性的调查中有 4 位专家认为属于“二级”,有 4 位专家认为属于“三级”,有位 1 专家认为属于“四级”;在经济合理性的调查中有 7 位专家认为属于“二级”,有 2 位专家认为属于“三级”;在社会效益的调查中有 4 位专家认为属于“一级”,有4 位专家认为属于“二级”,有 1 位专家认为属于“三级”。根据从指标if着眼认为科研课题 A 属于评语jV的人数占总参与评价人数的
7、比例数来建立被评对象与评语集之间的模糊关系。由评价数据得,11111212/0/90,/6/90.67rssrss,同理得130.33,r 14150,0rr,即1(0 0.67 0.33 0 0)r。同理得:从而得到科研课题 A 与评语集 V 之间的模糊关系矩阵为 综合评判 所以 9 名专家应用模糊评价法对某科研课题 A 给出的评语分数 N 为 二、模糊聚类分析法 在工程技术和经济管理中,常常需要对某些指标按照一定的标准(相似的程度或亲疏关系等)进行分类处理。例如,根据生物的某些性态对其进行分类,根据空气的性质对空气质量进行分类,以及工业上对产品质量的分类等等。这些对客观事物按一定的标准进行
8、分类的数学方法称为聚类分析,它是多元统计“物以聚类”的一种分类方法。然而,在科学技术、经济管理中有许多事物的类与类之间并无清晰的划分,边界具有模糊性,它们之间的关系更多的是模糊关系。对于这类事物的分类,一般用模糊数学方法、我们把应用模糊数学方法进行的聚类分析,称为模糊聚类分析。步骤 获取数据 设论域12=,nUx xx是被分类对象,其中由 m 个指标表示每个对象的性态,ix的观测值为 则得到原始数据矩阵为=ijn mAx。在实际问题中,不同的数据一般有不同的量纲,为了使有不同量纲的量能进行比较,需要将数据规格化,常用的方法有:数据标准化处理 为了让原始数据能满足模糊聚类的要求,需要将原始数据作
9、标准化处理,常用的方法有:(1)平移标准差变换 对第 i 个变量作标准化处理,将ijx换成ijx,即 式中:21111=,(1,2,)1nnjijjijjiixxSxxjmnn(2)平移极差变换 若经过平移标准差变换后,还存在数据0,1ijx,则再对其平移极差变换得 则得到模糊矩阵为 构造模糊相似矩阵 设论域12X=,nx xx,12,iiiimexxx为ix的观测值,则有数据矩阵()ijn mAx。ix和jx的相似系数为(,)ijijrR e e,求ijr的方法有:(1)夹角余弦法(2)相关系数法(3)距离法 一般取1(,),(,1,2,)ijijrc d x xi jn,其中,c为适当选取
10、的参数,它使得01ijr,可采用的距离有:1)Hamming 距离 2)Euclid 距离 3)Chebyshev 距离 (4)贴近度法 1)最大最小法 11(),(,1,2,)()mikjkkijmikjkkxxri jnxx 2)算术平均最小法 11(),(,1,2,)1()2mikjkkijmikjkkxxri jnxx 3)几何平均最小法 11(),(,1,2,).mikjkkijmikjkkxxri jnx x 聚类(1)模糊传递闭包法 用平方法求出模糊相似矩阵R的传递闭包()t R,再从大到小取一组0,1,并确定其相应的截矩阵,将其分类,画出动态聚类图。(2)直接聚类法 1)取最大
11、值11,对每个ix作相似类1|iRjijxxr,若ix和jx满足ijr 1,则看做是一类,当不同相似类出现公共元素时,将公共元素所在类合并。2)取次大值221(),找出2ijr的元素对(,),ijx x将对应于11的等价分类中ix和jx所在类合并成一类,所有情况合并后得到相应于2水平上的等价分类。3)依次类推,直到合并到 X 变成一类为止,最后得出动态聚类图。例题:某地区内有 12 个气象观测站,10 年来各站测得的年降水量如表1 所示。为了节省开支,想要适当减少气象观测站,试问减少哪些观察站可以使所得到的降水量信息仍然足够大?表 1 年降水量(mm)解:我们把 12 个气象观测站的观测值看成
12、12 个向量组,由于本题只给出了 10 年的观测数据,根据线性代数的理论可知,若向量组所含向量的个数大于向量的维数,则该向量组必然线性相关。于是只要求出该向量组的秩就可确定该向量组的最大无关组所含向量的个数,也就是需保留的气象观测站的个数。由于向量组中的其余向量都可由最大线性无关组线性表示,因此,可以使所得到的降水信息量足够大。用i=1,2,10 分别表示 1981 年,1982 年,1990 年。(1,2,101,2,12)ija ij,表示第 j个观测站第i年的观测值,记10 12()ijAa。利用 MATLAB 可计算出矩阵 A的秩r(A)=10,且任意 10 个列向量组成的向量组都是最
13、大线性无关组,例如,我们选取前10 个气象观测站的观测值作为最大线性无关组,则第 11,12 这两个气象观测站的降水量数据完全可以由前 10 个气象观测站的数据表示。设(1,2,12)ix i 表示第i个气象观测站的观测值,则有 若上述观测站的数据不是 10 年,而是超过 12 年,则此时向量的维数大于向量组所含的向量个数,这样的向量组未必线性相关。所以我们再考虑一般的解法,首先,我们利用已有的 12 个气象观测站的数据进行模糊聚类分析,最后确定从哪几类中去掉几个观测站。(1)建立模糊集合 设jA(这里我们仍用普通集合表示)表示第1,2,12j j()个观测站的降水量信息,我们利用模糊数学建立
14、隶属函数:利用 MATLAB 程序可以求得ja,(1,2,12)jbj 的值分别见表 2,表 3。表 3 均值ja的值 表 4 标准差(1,2,12)jbj 的值(2)利用格贴近度建立模糊相似矩阵 令 求模糊相似矩阵12 12()ijRr。(3)求R 的传递闭包 CC 求得4R是传递闭包,也就是所求的等价矩阵。取0.998,进行聚类,可以把观测站分为 4 类:上述分类具有明显的意义,15,x x属于该地区 10 年中平均降水量偏低的观测站,47,x x属于该地区 10 年平均降水量偏高的观测站,12x是平均降水量最大的观测站,而其余观测站属于中间水平。(4)选择保留观测站的准则 显然,去掉的观测站越少,则保留的信息量越大。为此,我们考虑在去掉的观测站数目确定的条件下,使得信息量最大的准则。由于该地区的观测站分为4类,且第 4 类只含有一个观测站,因此,我们从前3 类中各去掉一个观测站,我们的准则如下:其中,id表示该地区第i年的平均降水量,3id表示该地区去掉3 个观测站以后第i 年的平均降水量。利用MATLAB 软件,我们计算了28 组不同的方案(表 5),求得满足上述准则应去掉的观测站为:567,x x x,此时年平均降水量曲线如图 1 所示,二者很接近。图 1 年降水量比较示意图 表 5 前 3 类各取消一个站点的各方案的误差平方和