《2022年模式识别期末试题 .docx》由会员分享,可在线阅读,更多相关《2022年模式识别期末试题 .docx(14页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、精选学习资料 - - - - - - - - - 优秀资料 欢迎下载!一、 填空与选择填空(此题答案写在此试卷上,30 分)1、模式识别系统的基本构成单元包括:模式采集、特点提取与选择串、和模式分类;2、统计模式识别中描述模式的方法一般使用特真矢量;句法模式识别中模式描述方法一般有树、网;3、聚类分析算法属于(1) ;判别域代数界面方程法属于(3);( 1)无监督分类 2有监督分类(3)统计模式识别方法(4)句法模式识别方法4、如描述模式的特点量为0-1 二值特点量,就一般采纳(4)进行相像性度量;(1)距离测度(2)模糊测度(3)相像测度( 4)匹配测度5、 以下函数可以作为聚类分析中的准就
2、函数的有(1)( 3)( 4);(1)(2) 3 46、Fisher线性判别函数的求解过程是将N维特点矢量投影在(2)中进行;(1)二维空间(2)一维空间(3)N-1 维空间7、以下判别域界面方程法中只适用于线性可分情形的算法有(3) ;(1) ;线性可分、不行分都适用的有( 1)感知器算法( 2)H-K 算法(3)积存位势函数法BA , B 0, A 8、以下四元组中满意文法定义的有(1)( 2)( 4);(1) A, B, 0, 1, A01, A 0 A1 , A 1 A0 , B(2) A, 0, 1, A0, A 0 A, A S (3) S, a, b, S 00 S, S 11
3、S, S 00, S 11, (4) A, 0, 1, A01, A 0 A1, A 1 A0, A 9、影响层次聚类算法结果的主要因素有(类别数目) );运算模式距离的测度、 (聚类准就、类间距离门限、预定的10、欧式距离具有( 1 、2 );马式距离具有(1、2、3、 4 );( 1)平移不变性(2)旋转不变性(3)尺度缩放不变性(4)不受量纲影响的特性11、线性判别函数的正负和数值大小的几何意义是(正(负)表示样本点位于判别界面法向量指向的正(负)半空间中;肯定值正比于样本点到判别界面的距离;);12、感知器算法 1 ;( 1)只适用于线性可分的情形;(2)线性可分、不行分都适用;名师归
4、纳总结 - - - - - - -第 1 页,共 9 页精选学习资料 - - - - - - - - - 13、积存势函数法较之于优秀资料欢迎下载!(也可用于线性可分情形);H-K算法的优点是 (该方法可用于非线性可分情形K x k K x , x k 位势函数 Kx,x k 与积存位势函数 Kx 的关系为(x k X);14、在统计模式分类问题中,聂曼- 皮尔逊判决准就主要用于(某一种判决错误较另一种判决错误更为重要 )情形;最小最大判决准就主要用于(先验概率未知的)情形;15、“ 特点个数越多越有利于分类” 这种说法正确吗?(错误 );特点选择的主要目的是(从 n 个特点中选出最有利于分类
5、的的 m个特点( mn )的条件下,可以使用分支定界法以削减运算量;16、 散度 Jij越大,说明i 类模式与j 类模式的分布( 差别越大 );当i 类模式与j 类模式的分布相同时, Jij= ( 0);17、 已知有限状态自动机Af=,Q, ,q0, F ,=0 ,1 ;Q=q0,q1 ; : q0 ,0= q1, q0 ,1= q1, q1 ,0=q0 , q1 ,1=q0 ;q0=q0;F=q0 ;现有输入字符串: a 00011101011,b 1100110011,c 101100111000, d0010011 ,试问,用Af对上述字符串进行分类的结果为( 1:a,d;2:b,c
6、););18、影响聚类算法结果的主要因素有(已知类别的样本质量;分类准就;特点选取;模式相像性测度;19、模式识别中,马式距离较之于欧式距离的优点是();平移不变性;旋转不变性;尺度不变性;考虑了模式的分布;20、基于二次准就函数的H-K 算法较之于感知器算法的优点是();可以判别问题是否线性可分;其解完全适用于非线性可分的情形;其解的适应性更好;运算量小;21、影响基本C均值算法的主要因素有();样本输入次序;模式相像性测度;聚类准就;初始类心的选取;22、位势函数法的积存势函数Kx 的作用相当于Bayes 判决中的();先验概率;后验概率;类概率密度;类概率密度与先验概率的乘积;名师归纳总
7、结 23、在统计模式分类问题中,当先验概率未知时,可以使用();J 对特点第 2 页,共 9 页最小缺失准就;最小最大缺失准就;最小误判概率准就;N-P 判决;24、在()情形下,用分支定界法做特点选择运算量相对较少; Cndn,(n 为原特点个数, d 为要选出的特点个数) ;样本较多; 选用的可分性判据数目单调不减;选用的可分性判据J 具有可加性;- - - - - - -精选学习资料 - - - - - - - - - 25、 散度 JD是依据(优秀资料欢迎下载!)构造的可分性判据;先验概率;后验概率;类概率密度;信息熵;几何距离;26、似然函数的概型已知且为单峰,就可用()估量该似然函
8、数;矩估量;最大似然估量;Bayes 估量; Bayes 学习; Parzen 窗法;27、 Kn近邻元法较之Parzen 窗法的优点是();所需样本数较少;稳固性较好;辨论率较高;连续性较好;28、从分类的角度讲,用 DKLT做特点提取主要利用了 DKLT的性质:();变换产生的新重量正交或不相关;以部分新的重量表示原矢量均方误差最小;使变换后的矢量能量更趋集中;29、一般,剪辑k-NN 最近邻方法在()的情形下成效较好;样本数较大;样本数较小;样本呈团状分布;样本呈链状分布;30、假如以特点向量的相关系数作为模式相像性测度,就影响聚类算法结果的主要因素有();已知类别样本质量;分类准就;特
9、点选取;量纲;二、 15 分 简答及证明题(1)影响聚类结果的主要因素有那些?(2)证明马氏距离是平移不变的、非奇特线性变换不变的;答:( 1)分类准就,模式相像性测度,特点量的选择,量纲;(2)证明:2 分2 分1 分 三、 8 分 说明线性判别函数的正负和数值大小在分类中的意义并证明之;答:( 1)(4 分)的肯定值正比于到超平面的距离式1-1 的分子为判别函数肯定值, 上式说明,的值正比于到超平面的距离,一个特点矢量代入判别函数后所得值的肯定值越大说明该特点点距判别界面越远;(2)( 4 分) 判别函数值的正负表示出特点点位于哪个半空间中,或者换句话说,表示特点点位于界面 的哪一侧;名师
10、归纳总结 - - - - - - -第 3 页,共 9 页精选学习资料 - - - - - - - - - 四、12 分,每问 4 分优秀资料欢迎下载!1 和类型2分别代表农田在目标识别中,假定有农田和装甲车两种类型,类型和装甲车,它们的先验概率分别为0.8 和 0.2 ,缺失函数如表1 所示;现在做了三次试验,获得三个样本的类概率密度如下:0.3 ,0.1 ,0.6 :0.7 ,0.8 ,0.3 (1)试用贝叶斯最小误判概率准就判决三个样本各属于哪一个类型;(2)假定只考虑前两种判决,试用贝叶斯最小风险准就判决三个样本各属于哪一类;(3)把拒绝判决考虑在内,重新考核三次试验的结果;表 1 类
11、型缺失 1 判决解:由题可知:1,1 4 5 1 1 1 ,(1)( 4 分) 依据贝叶斯最小误判概率准就知:,就可以任判;,就判为;,就判为;(2)(4 分) 由题可知:就,判为;,判为;,判为;名师归纳总结 - - - - - - -第 4 页,共 9 页精选学习资料 - - - - - - - - - ( 3)(4 分) 对于两类问题,对于样本优秀资料欢迎下载!,假设已知,有就对于第一个样本,就拒判;,就拒判;,拒判;五、 1. 监督学习与非监督学习的区分:监督学习方法用来对数据实现分类,分类规章通过训练获得;该训练集由带分类号的数据集组成,因此监督学习方法的训练过程是离线的;非监督学习
12、方法不需要单独的离线训练过程,也没有带分类号 (标号) 的训练数据集, 一般用来对数据集进行分析,如聚类,确定其分布的主重量等;(实例:道路图)就道路图像的分割而言,监督学习方法就先在训练用图像中猎取道路象素与非道路象素集,进行分类器设计,然后用所设计的分类器对道路图像进行分割;使用非监督学习方法,就依据道路路面象素与非道路象素之间的聚类分析进行聚类运算,以实现道路图像的分割;2. 线性分类器三种最优准就:Fisher准就 :依据两类样本一般类内密集, 类间分别的特点,查找线性分类器正确的法线向量方向,使两类样本在该方向上的投影满意类内尽可能密集,类间尽可能分开;该种度量通过类内离散矩阵Sw和
13、类间离散矩阵Sb 实现;感知准就函数 :准就函数以使错分类样本到分界面距离之和最小为原就;其优点是通过错分类样本供应的信息对分类器函数进行修正,感知器的基础;这种准就是人工神经元网络多层支持向量机 :基本思想是在两类线性可分条件下,所设计的分类器界面使两类之间的间隔为最大 , 它的基本动身点是使期望泛化风险尽可能小;一、 试说明 Mahalanobis 距离平方的定义,到某点的 意义,它与欧氏距离的区分与联系;答: Mahalanobis 距离的平方定义为:Mahalanobis 距离平方为常数的轨迹的几何名师归纳总结 其中 x,u 为两个数据,是一个正定对称矩阵(一般为协方差矩阵);依据定义
14、,距某第 5 页,共 9 页- - - - - - -精选学习资料 - - - - - - - - - 优秀资料欢迎下载! ,就 Mahalanobis距离一点的 Mahalanobis 距离相等点的轨迹是超椭球,假如是单位矩阵就是通常的欧氏距离;二、 试说明用监督学习与非监督学习两种方法对道路图像中道路区域的划分的基本做法,以说明 这两种学习方法的定义与它们间的区分;答:监督学习方法用来对数据实现分类,分类规章通过训练获得;该训练集由带分类号的数据集组成,因此监督学习方法的训练过程是离线的;非监督学习方法不需要单独的离线训练过程,也没有带分类号 (标号) 的训练数据集, 一 般用来对数据集进
15、行分析,如聚类,确定其分布的主重量等;就道路图像的分割而言,监督学 进行分类器设计, 然后用所设计的 习方法就先在训练用图像中猎取道路象素与非道路象素集,分类器对道路图像进行分割;使用非监督学习方法,就依据道路路面象素与非道路象素之间的 聚类分析进行聚类运算,以实现道路图像的分割;三、 试述动态聚类与分级聚类这两种方法的原理与不同;答:动态聚类是指对当前聚类通过迭代运算改善聚类;分级聚类就是将样本个体,按相像度标准合并,随着相像度要求的降低实现合并;四、 试说明以下问题求解是基于监督学习或是非监督学习:1. 求数据集的主重量2. 汉字识别 3. 自组织特点映射4. CT 图像的分割答: 1 、
16、求数据集的主重量是非监督学习方法;2、汉字识别对待识别字符加上相应类别名有监督学习方法;3、自组织特点映射将高维数组按保留近似度向低维映射非监督学习;4、CT图像分割按数据自然分布聚类非监督学习方法;五、 试列举线性分类器中最闻名的三种正确准就以及它们各自的原理;答:线性分类器三种最优准就:Fisher准就 :依据两类样本一般类内密集, 类间分别的特点,查找线性分类器正确的法线向量方向, 使两类样本在该方向上的投影满意类内尽可能密集,类内离散矩阵Sw和类间离散矩阵Sb 实现;类间尽可能分开; 该种度量通过感知准就函数 :准就函数以使错分类样本到分界面距离之和最小为原就;其优点是通过错分类样本供
17、应的信息对分类器函数进行修正,这种准就是人工神经元网络多层感知器的基础;支持向量机 :基本思想是在两类线性可分条件下,大, 它的基本动身点是使期望泛化风险尽可能小;所设计的分类器界面使两类之间的间隔为最十、 对一副道路图像,期望把道路部分划分出来,可以采纳以下两种方法:1在该图像中分别在道路部分与非道路部分画出一个窗口,把在这两个窗口中的象素数据作为训 练集,用 Fisher 准就方法求得分类器参数,再用该分类器对整幅图进行分类;2将整幅图的每个象素的属性记录在一张数据表中,然后用某种方法将这些数据按它们的自然分名师归纳总结 布状况划分成两类;因此每个象素就分别得到相应的类别名,从而实现了道路
18、图像的分割;试问以上两第 6 页,共 9 页- - - - - - -精选学习资料 - - - - - - - - - 优秀资料 欢迎下载!种方法哪一种是监督学习,哪个是非监督学习?答: 第一种方法中标记了两类样本的标号,需要人手工干预训练过程,属于监督学习方法;其次种方法只是依照数据的自然分布,把它们划分成两类,属于非监督学习方法;十三、 试分析五种常用决策规章思想方法的异同;答、五种常用决策是: 1. 基于最小错误率的贝叶斯决策,利用概率论中的贝叶斯公式,得出访得错误率最小的分类规章; 2. 基于最小风险的贝叶斯决策,引入了缺失函数, 得出访决策风险最小的分类;当在 01 缺失函数条件下,
19、基于最小风险的贝叶斯决策变成基于最小错误率的贝叶斯决策; 3. 在限定一类错误率条件下使另一类错误率最小的两类别决策; 4. 最大最小决策:类先验概率未知,考察先验概率变化对错误率的影响,找出访最小贝叶斯贡献最大的先验概率,以这种最坏情形设计分类器; 5. 序贯分类方法,除了考虑分类造成的缺失外,仍考虑特点猎取造成的代价,先用一部分特点分类,然后逐步加入性特点以削减分类缺失,同时平稳总的缺失,以求得最有效益;十四、 假设在某个地区细胞识别中正常(w1)和反常( w2)两类先验概率分别为 Pw 1=0.9 ,Pw2=0.1 ,现有一待识别的细胞,其观看值为 x ,从类条件概率密度分布曲线上查得
20、P x w 1 0 2.,P x w 2 0 . 4,并且已知 11 0,12 6,21 1,22 0试对该细胞 x 用一下两种方法进行分类:1. 基于最小错误率的贝叶斯决策;2. 基于最小风险的贝叶斯决策;请分析两种结果的异同及缘由;2. 名师归纳总结 - - - - - - -第 7 页,共 9 页精选学习资料 - - - - - - - - - 优秀资料 欢迎下载!十五、 有线性判别函数,为什么仍要引进非线性判别函数?分析由“ 线性判别函数” 向“ 非线性判别函数” 推广的思想和方法;答:实际中有许多模式识别问题并不是线性可分的,这时就需要采纳非线性分类器,比如当两类样本分不具有多峰性质
21、并相互交叉时,简洁的线性判别函数往往会带来较大的分类错误;这时, 树分类器作为一种分段线性分类器,经常能有效地应用于这种情形;十六、 1.什么是特点选择?2. 什么是 Fisher线性判别?答: 1. 特点选择就是从一组特点中选择出一些最有效的特点以达到降低特点空间维数的目的; 2. Fisher 线性判别:可以考虑把 d 维空间的样本投影到一条直线上,形成一维空间,即把维数压缩到一维, 这在数学上简洁办到,然而,即使样本在 d 维空间里形成如干紧凑的相互分得开的集群,如果把它们投影到一条任意的直线上,也可能使得几类样本混在一起而变得无法识别;但是在一般情形下,总可以找到某个方向,使得在这个方
22、向的直线上,样本的投影能分开得最好;问题是如何依据实际情形找到这条最好的、最易于分类的投影线,这就是 Fisher 算法所要解决的基本问题;十七、 写出两类和多类情形下最小风险贝叶斯决策判别函数和决策面方程;名师归纳总结 - - - - - - -第 8 页,共 9 页精选学习资料 - - - - - - - - - 优秀资料 欢迎下载!二十、 定性说明基于参数方法和非参数方法的概率密度估量有什么区分?答: 基于参数方法:是由已知类别的样本集对总体分布的某些参数进行统计推断非参数方法:已知样本所属类别,但未知总体概率密度函数形式二十二、 简述支持向量机的基本思想;答: SVM从线性可分情形下的
23、最优分类面进展而来;最优分类面就是要求分类线不但能将两类正确分开 训练错误率为0 ,且使分类间隔最大;SVM考虑查找一个满意分类要求的超平面,并且使训练集中的点距离分类面尽可能的远,也就是查找一个分类面使它两侧的空白区域 margin 最大;过两类样本中离分类面最近的点,且平行于最优分类面的超平面上 H1,H2的训练样本就叫支持向量;3 对两类问题,如缺失函数;11 22 0 ,12 0 ,21 0 ,试求基于最小风险贝叶斯决策分界面处的两类错误率 P e x 1 1 P 1 x 、P e x 2 1 P 2 x 与 12 、21 的关系解:由于在基于最小风险贝叶斯决策分界面处有名师归纳总结 R1x11P1x12P2x12P2x R 2x221P 1x22P 2x21P1x 而 在 两 类R1xR2x12P 2x21P 1x问题中,P e x11P1x P2x ,P e x21PxP 1x 故第 9 页,共 9 页P e x121P e x212- - - - - - -