2022年模式识别期末试题.docx

上传人:w*** 文档编号:23344315 上传时间:2022-06-30 格式:DOCX 页数:19 大小:25.10KB
返回 下载 相关 举报
2022年模式识别期末试题.docx_第1页
第1页 / 共19页
2022年模式识别期末试题.docx_第2页
第2页 / 共19页
点击查看更多>>
资源描述

《2022年模式识别期末试题.docx》由会员分享,可在线阅读,更多相关《2022年模式识别期末试题.docx(19页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、2022年模式识别期末试题 一、 填空与选择填空(本题答案写在此试卷上,30 分) 1、模式识别系统得基本构成单元包括: 模式采集 、 特征提取与选择 与 模式分类 。 2、统计模式识别中描述模式得方法一般运用 特真矢量 ;句法模式识别中模式描述方法一般有 串 、 树 、 网 。 、聚类分析算法属于 (1) ;判别域代数界面方程法属于 (3) 。 (1)无监督分类 (2)有监督分类 (3)统计模式识别方法(4)句法模式识别方法 4、若描述模式得特征量为 0二值特征量,则一般采纳 (4) 进行相像性度量。 ()距离测度 (2)模糊测度 (3)相像测度 ()匹配测度 5、 下列函数可以作为聚类分析

2、中得准则函数得有 ()(3)() 。 (1) (2) (3) (4) 6、Fisher 线性判别函数得求解过程就是将维特征矢量投影在 (2) 中进行 。 (1)二维空间 (2)一维空间 (3)N1 维空间 、下列判别域界面方程法中只适用于线性可分状况得算法有 (1) ;线性可分、不行分都适用得有 (3) 。 (1)感知器算法 ()HK 算法 (3)积累位势函数法 8、下列四元组中满意文法定义得有 (1)(2)(4) 。 () ( A A , B B , 0 0 , 1 , A A 01, 0 0 A A 1 1 , 1 1 A A 0 , B B , 0, , A A ) ) (2)( ( A

3、 A , 0 , , A A , A A 0 0 A A , A A ) ) () ( , a a , b b , , S 00 S S , S 1 1 , 0 0 , S S 1 , ) ) (4) ( A A , , 1 1 , , , A A 0 0 A A , A A 0 , A A ) ) 、影响层次聚类算法结果得主要因素有( 计算模式距离得测度、(聚类准则、类间距离门限、预定得类别数目))。 10、欧式距离具有( 1 1 、 2 );马式距离具有( 1 1 、2 2 、3 3 、 4 ). )(变不转旋)(性变不移平性()尺度缩放不变性(4)不受量纲影响得特性 、线性判别函数得正负

4、与数值大小得几何意义就是( 正( ( 负) ) 表示样本点位于判别界面法向量指向得正( ( 负)半空间中; ; 肯定值正比于样本点到判别界面得距离. .)。 1、感知器算法 1 1 。 ()只适用于线性可分得状况;()线性可分、不行分都适用。 13、积累势函数法较之于 H-算法得优点就是( 该方法可用于非线性可分状况(也可用于线性可分状况) );位势函数 K(x,x k )与积累位势函数 K()得关系为()。 14、在统计模式分类问题中,聂曼皮尔逊判决准则主要用于( 某一种判决错误较另一种判决错误更为重要)状况;最小最大判决准则主要用于( 先验概 率未知得)状况。 5、特征个数越多越有利于分类

5、这种说法正确吗?( 错误 )。特征选择得主要目得就是(从 从 n n 个特征中选出最有利于分类得得个特征(m m n n ),以降低特征维数)。一般在( 可分性判据对特征个数具有单调性)与( C n >n )得条件下,可以运用分支定界法以削减计算量。 16、 散度 Jij 越大,说明wi 类模式与j 类模式得分布( 差别越大);当wi 类模式与wj 类模式得分布相同时,i=( ). 1、 已知有限状态自动机 Af=(,Q,d,q,F),=,;=0,q1;:d(q0,0)= 1,d(q0,1)= q,d(q1,)q0,d(q,1)=q0;q=q0;F=q.现有输入字符串:(a) ,(b)

6、1101011,() ,(d)01011,试问,用 A对上述字符串进行分类得结果为( ω: :,d d ;ω 2: b b , c )。 18、影响聚类算法结果得主要因素有( )。 已知类别得样本质量;分类准则;特征选取;模式相像性测度。 9、模式识别中,马式距离较之于欧式距离得优点就是( )。 转旋;性变不移平不变性;尺度不变性;考虑了模式得分布。 、基于二次准则函数得-K 算法较之于感知器算法得优点就是( )。就题问别判以可是否线性可分;其解完全适用于非线性可分得状况; .小量算计;好更性应适得解其21、影响基本 C 均值算法得主要因素有( )。 样本输入依次;模式

7、相像性测度;聚类准则;初始类心得选取。 2、位势函数法得积累势函数 K(x)得作用相当于 Baye判决中得( )。后;率概验先验概率;类概率密度;类概率密度与先验概率得乘积。 2、在统计模式分类问题中,当先验概率未知时,可以运用( ).最小最;则准失损小最大损失准则;最小误判概率准则;NP 判决。 24、在( )状况下,用分支定界法做特征选择计算量相对较少。C d >n,(n 为原特征个数,为要选出得特征个数);样本较多;选用得可分性判据 J 对特征数目单调不减;选用得可分性判据 J 具有可加性。 5、 散度 J D 就是依据( )构造得可分性判据。 先验概率;后验概率;类概率密度;信息

8、熵;几何距离。 2、似然函数得概型已知且为单峰,则可用( )估计该似然函数。 矩估计;最大似然估计;Byes 估计;ayes 学习;Parzen 窗法. 2、Kn 近邻元法较之 Parzen 窗法得优点就是( ). 所需样本数较少;稳定性较好;辨别率较高;连续性较好。 2、从分类得角度讲,用 DKL做特征提取主要利用了KT 得性质:( )。新得生产换变重量正交或不相关;以部分新得重量表示原矢量均方误差最小;使变换后得矢量能量更趋集中; 29、一般,剪辑-最近邻方法在( )得状况下效果较好。;小较数本样;大较数本样样本呈团状分布;样本呈链状分布。 30、假如以特征向量得相关系数作为模式相像性测度

9、,则影响聚类算法结果得主要因素有( )。 .纲量;取选征特;则准类分;量质本样别类知已二、 (分)简答及证明题 (1)影响聚类结果得主要因素有那些? ()证明马氏距离就是平移不变得、非奇异线性变换不变得。 答:(1)分类准则,模式相像性测度,特征量得选择,量纲. (2)证明: ( ( 分) (2 2 分) ( (1 1 分) 三、(8 分)说明线性判别函数得正负与数值大小在分类中得意义并证明之。 答: (1 1 )(4 4 分) ) 得肯定值正比于到超平面得距离 式(1-)得分子为判别函数肯定值,上式表明,得值正比于到超平面得距离,一个特征矢量代入判别函数后所得值得肯定值越大表明该特征点距判别

10、界面越远。 ( 2) (4 4 分) )判别函数值得正负表示出特征点位于哪个半空间中,或者换句话说,表示特征点位于界面得哪一侧. 四、 (2 12 分,每问分) 在目标识别中,假定有农田与装甲车两种类型,类型 w 1 与类型 w 2 分别代表农田与装甲车,它们得先验概率分别为、8 与、2,损失函数如表 1 所示。现在做了三次试验,获得三个样本得类概率密度如下: :0、3,、1,0、6 :0、7,0、8,、3 () ;型类个一哪于属各本样个三决判则准率概判误小最斯叶贝用试(2) ;类一哪于属各本样个三决判则准险风小最斯叶贝用试,决判种两前虑考只定假(3) 把拒绝判决考虑在内,重新考核三次试验得结

11、果。 表 1 类型 损失 判决 1 4 5 1 1 解:由题可知:,, , ()4 (4 分)依据贝叶斯最小误判概率准则知: ,则可以任判;,则判为;,则判为; (2) (4 4 分) )由题可知: 则 ,判为; ,判为; ,判为; () (4 4 分)对于两类问题,对于样本,假设已知,有 则对于第一个样本, ,则拒判; ,则拒判; ,拒判. 五、1、监督学习与非监督学习得区分: 监督学习方法用来对数据实现分类,分类规则通过训练获得。该训练集由带分类号得数据集组成,因此监督学习方法得训练过程就是离线得。 没也,程过练训线离得独单要需不法方习学督监非有带分类号(标号)得训练数据集,一般用来对数据

12、集进行分析,如聚类,确定其分布得主重量等。 (实例:道路图)就道路图像得分割而言,监督学习方法则先在训练用图像中获得道路象素与非道路象素集,进行分类器设计,然后用所设计得分类器对道路图像进行分割。 运用非监督学习方法,则依据道路路面象素与非道路象素之间得聚类分析进行聚类运算,以实现道路图像得分割。 2、 线性分类器三种最优准则: Fis r er 准则:依据两类样本一般类内密集, 类间分别得特点,找寻线性分类器最佳得法线向量方向,使两类样本在该方向上得投影满意类内尽可能密集,类间尽可能分开。 该种度量通过类内离散矩阵与类间离散矩阵 S实现。 感知准则函数:准则函数以使错分类样本到分界面距离之与

13、最小为原则. 错过通是就点优其分类样本供应得信息对分类器函数进行修正,这种准则就是人工神经元网络多层感知器得基础。 支持向量机:基本思想就是在两类线性可分条件下,所设计得分类器界面使两类之间得间隔为最大, 它得基本动身点就是使期望泛化风险尽可能小。 一、 试说明 Mhalanbis 距离平方得定义,到某点得ahalois 距离平方为常数得轨迹得几何意义,它与欧氏距离得区分与联系. 答:ahanbi距离得平方定义为: 对定正个一是就,据数个两为u,x中其称矩阵(一般为协方差矩阵).依据定义,距某一点得ahalaobs 距离相等点得轨迹就是超椭球,假如就是单位矩阵 Σ,则 Mhlabi

14、s 距离就就是通常得欧氏距离。 二、 试说明用监督学习与非监督学习两种方法对道路图像中道路区域得划分得基本做法,以说明这两种学习方法得定义与它们间得区分. 答:监督学习方法用来对数据实现分类,分类规则通过训练获得.该训练集由带分类号得数据集组成,因此监督学习方法得训练过程就是离线得。 线离得独单要需不法方习学督监非训练过程,也没有带分类号(标号)得训练数据集,一般用来对数据集进行分析,如聚类,确定其分布得主重量等。就道路图像得分割而言,监督学习方法则先在训练用图像中获得道路象素与非道路象素集,进行分类器设计,然后用所设计得分类器对道路图像进行分割。运用非监督学习方法,则依据道路路面象素与非道路

15、象素之间得聚类分析进行聚类运算,以实现道路图像得分割. 三、 试述动态聚类与分级聚类这两种方法得原理与不同。 答:动态聚类就是指对当前聚类通过迭代运算改善聚类;分级聚类则就是将样本个体,按相像度标准合并,随着相像度要求得降低实现合并。 四、 试说明以下问题求解就是基于监督学习或就是非监督学习: 、1 汉 、2 量分主得集据数求字识别 3、 自组织特征映射 4、 C图像得分割 答: 1、求数据集得主重量就是非监督学习方法; 、2、;法方习学督监有号别类应相上加符字别识待对别识字汉3 将-射映征特织组自高维数组按保留近似度向低维映射非监督学习; 、CT 图像分割按数据自然分布聚类非监督学习方法;

16、五、 试列举线性分类器中最闻名得三种最佳准则以及它们各自得原理。 答:线性分类器三种最优准则: Fi r her 准则:依据两类样本一般类内密集, 类间分别得特点,找寻线性分类器最佳得法线向量方向,使两类样本在该方向上得投影满意类内尽可能密集,类间尽可能分开。该种度量通过类内离散矩阵 Sw 与类间离散矩阵 Sb 实现。数函则准知感 感知准则函数:准则函数以使错分类样本到分界面距离之与最小为原则。其优点就是通过错分类样本供应得信息对分类器函数进行修正,这种准则就是人工神经元网络多层感知器得基础。机量向持支 支持向量机:基本思想就是在两类线性可分条件 下,所设计得分类器界面使两类之间得间隔为最大,

17、 它得基本动身点就是使期望泛化风险尽可能小。 十、对一副道路图像,希望把道路部分划分出来,可以采纳以下两种方法: 1。在该图像中分别在道路部分与非道路部分画出一个窗口,把在这两个窗口中得象素数据作为训练集,用 Fsr 准则方法求得分类器参数,再用该分类器对整幅图进行分类。 2将整幅图得每个象素得属性记录在一张数据表中,然后用某种方法将这些数据按它们得自然分布状况划分成两类.因此每个象素就分别得到相应得类别名,从而实现了道路图像得分割。试问以上两种方法哪一种就是监督学习,哪个就是非监督学习? 答:第一种方法中标记了两类样本得标号,须要人手工干预训练过程,属于监督学习方法; 其次种方法只就是依照数

18、据得自然分布,把它们划分成两类,属于非监督学习方法。 十三、试分析五种常用决策规则思想方法得异同。 答、五种常用决策就是: 1、 基于最小错误率得贝叶斯决策,利用概率论中得贝叶斯公式,得出访得错误率最小得分类规则。 2、 基于最小风险得贝叶斯决策,引入了损失函数,得出访决策风险最小得分类。当在 0-1 损失函数条件下,基于最小风险得贝叶斯决策变成基于最小错误率得贝叶斯决策。 3、 在限定一类错误率条件下使另一类错误率最小得两类别决策。 4、 最大最小决策:类先验概率未知,考察先验概率改变对错误率得影响,找出访最小贝叶斯奉献最大得先验概率,以这种最坏状况设计分类器. 、 序贯分类方法,除了考虑分

19、类造成得损失外,还考虑特征获得造成得代价,先用一部分特征分类,然后逐步加入性特征以削减分类损失,同时平衡总得损失,以求得最有效益。 十四、假设在某个地区细胞识别中正常(w 1 )与异样(w 2 )两类先验概率分别为 P(w 1 )=0、9,P(w 2 )=、1,现有一待识别得细胞,其视察值为 x,从类条件概率密度分布曲线上查得,,并且已知, 试对该细胞 x 用一下两种方法进行分类:1、基于最小错误率得贝叶斯决策;2、基于最小风险得贝叶斯决策;请分析两种结果得异同及缘由。 2、 十五、有线性判别函数,为什么还要引进非线性判别函数?分析由线性判别函数向非线性判别函数推广得思想与方法. 答:实际中有

20、许多模式识别问题并不就是线性可分得,这时就须要采纳非线性分类器,比如当两类样本分不具有多峰性质并相互交织时,简洁得线性判别函数往往会带来较大得分类错误.这时,树分类器作为一种分段线性分类器,经常能有效地应用于这种状况。 十六、1、 什么就是特征选择?、 什么就是iher 线性判别? 答:1、 特征选择就就是从一组特征中选择出一些最有效得特征以达到降低特征空间维数得目得。 2、 Fishr 线性判别:可以考虑把维空间得样本投影到一条直线上,形成一维空间,即把维数压缩到一维,这在数学上简单办到,然而,即使样本在 d 维空间里形成若干紧凑得相互分得开得集群,假如把它们投影到一条随意得直线上,也可能使

21、得几类样本混在一起而变得无法识别。但就是在一般状况下,总可以找到某个方向,使得在这个方向得直线上,样本得投影能分开得最好。问题就是如何依据实际状况找到这条最好得、最易于分类得投影线,这就就是iher 算法所要解决得基本问题。 十七、写出两类与多类状况下最小风险贝叶斯决策判别函数与决策面方程。 二十、定性说明基于参数方法与非参数方法得概率密度估计有什么区分? 答: 基于参数方法:就是由已知类别得样本集对总体分布得某些参数进行统计推断 非参数方法:已知样本所属类别,但未知总体概率密度函数形式 二十二、简述支持向量机得基本思想。 答:SVM 从线性可分状况下得最优分类面发展而来。 最优分类面就就是要

22、求分类线不但能将两类正确分开(训练错误率为 0),且使分类间隔最大。SVM考虑找寻一个满意分类要求得超平面,并且使训练集中得点距离分类面尽可能得远,也就就是找寻一个分类面使它两侧得空白区域(agn)最大。过两类样本中离分类面最近得点,且平行于最优分类面得超平面上 1 ,H 2 得训练样本就叫支持向量。 对两类问题,若损失函数;,试求基于最小风险贝叶斯决策分界面处得两类错误率、 与、得关系 解:由于在基于最小风险贝叶斯决策分界面处有 1 11 1 12 2 12 2 2 21 1 22 2 21 11 2 12 2 21 1( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )( ) ( ) ( ) ( )R P P P R P P PR R P Pa l w l w l w a l w l w l wa a l w l w= + = = + = =x x x x x x x xx x x x而 在 两 类问题中,,故 第19页 共19页第 19 页 共 19 页第 19 页 共 19 页第 19 页 共 19 页第 19 页 共 19 页第 19 页 共 19 页第 19 页 共 19 页第 19 页 共 19 页第 19 页 共 19 页第 19 页 共 19 页第 19 页 共 19 页

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > 策划方案

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁