《现代图像分析知识点 (54).pdf》由会员分享,可在线阅读,更多相关《现代图像分析知识点 (54).pdf(22页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、Modern Image Analysis9.3 图像识别9.3 图像识别什么是模式?广义地说,存在于时间和空间中可观察的物体,如果我们可以区别它们是否相同或是否相似,都可以称之为模式。模式所指的不是事物本身,而是从事物获得的信息,因此,模式往往表现为具有时间和空间分布的信息。模式的直观特性:可观察性 可区分性 相似性人和动物的模式识别能力是极其平常的,但对计算机来说却是非常困难的。Modern Image Analysis模式识别简史9.3 图像识别9.3 图像识别30年代 Fisher提出统计分类理论4050年代,神经网络结构被提出6070年代,统计模式识别飞速发展,出现“维数灾难”80年
2、代以Hopfield网、BP网为代表的神经网络模型导致人工神经元网络复活90年代小样本学习理论,支持向量机也受到了很大的重视19731973年IEEEIEEE发起了模式识别的国际会议“ICPR”ICPR”,成立了国际模式识别协会-“IAPR”-“IAPR”;19771977年IEEEIEEE的计算机学会成立了模式分析与机器智能(PAMIPAMI)委员会;国内的组织有电子学会,通信学会,自动化协会,中文信息学会.。Modern Image Analysis通过这三个特征进行分类可能无法得到一个令人满意的结果。因此,可以再增加一些特征:大小,纹理等。9.3 图像识别9.3 图像识别维数灾难(cur
3、se of dimensionality)Modern Image Analysis如果将高维空间向低维空间投影,高维空间隐藏的问题将会显现出来:过多的特征导致的过拟合现象:训练集上表现良好,但是对新数据缺乏泛化能力。9.3 图像识别9.3 图像识别Modern Image Analysis2个特征代替3个特征进行分类器的学习:尽管训练集上分类准确率不如3维下的高,但是具备更好的泛化能力。9.3 图像识别9.3 图像识别Modern Image Analysis需要精确的非线性决策边界的分类器,应当慎重考虑特征的数量。比如 neural network,KNN,decision trees泛化
4、能力较好的分类器,可以适当增加特征的数量。比如naive Bayesian,linear classifier如何从中选出最优的特征?尝试所有特征的组合,从中挑出M个最优的特征特征选择算法来特征的数量以及选择特征交叉验证也常常被用于检测与避免过拟合问题。9.3 图像识别9.3 图像识别如何避免“维数灾难”?Modern Image Analysis 统计模式识别 结构模式识别 模糊模式识别 人工神经网络模式识别在本节中,我们将对统计模式识别、结构模式识别和人工神经网络模式识别等几种常见的图像模式识别方法进行简要介绍。模式分类的主要方法:9.3 图像识别9.3 图像识别Modern Image
5、Analysis 统计模式识别统计模式识别以判别函数为基础,利用判别函数对模式进行分类,是最基本的识别技术之一,其过程如图所示。数字化预处理特征提取分类学习特征选择识别分析图像样本ik识别分类结果图9.3.1 统计识别的基本过程9.3 图像识别9.3 图像识别Modern Image Analysis此时只需要处理与D相应的一组权的输入模式并判断输出符号即可分类,其原理如图9.3.2所示。12nn+11x2x0 xnx+1-112DD+1-11x2x图9.3.2 两类线性分类器9.3 图像识别9.3 图像识别Modern Image Analysis理论基础:概率论、数理统计主要方法:线性、非
6、线性分类、Bayes决策、聚类分析主要优点:(1)技术比较成熟(2)能考虑干扰噪声等影响(3)识别模式基元能力强主要缺点:(1)对结构复杂的模式抽取特征困难(2)不能反映模式的结构特征,难以描述模式的性质(3)难以从整体角度考虑识别问题9.3 图像识别9.3 图像识别Modern Image Analysis结构模式识别结构模式识别系统将对象分解为若干个基本单元基元,用基元和他们的结构关系描述对象,运用形式语言理论进行句法分析,根据其是否符合某一类的文法而决定其类别。由三个主要部分组成,分别是:预处理、模式描述和句法分析。该系统的简单框图如图9.3.3所示。预处理模式描述语法分析输入模式识别学
7、习样本模式语法推理zL G图9.3.3 结构模式识别系统框图9.3 图像识别9.3 图像识别Modern Image Analysis1)预处理的目的是:通过模式的编码和近似来压缩样本数据,通过滤波、复原和增强,来消除噪声和复原缺损,以利于下一步的模式描述。2)模式描述部分由模式分割和基元抽取两部分组成。3)文法推理和句法分析构成结构模式识别理论的中心内容。9.3 图像识别9.3 图像识别Modern Image Analysis理论基础:形式语言、自动机技术主要方法:自动机技术、CYK剖析算法、Early算法、转移图法主要优点:(1)识别方便,可以从简单的基元开始,由简至繁。(2)能反映模式
8、的结构特征,能描述模式的性质。(3)对图像畸变的抗干扰性较强。主要缺点:当存在干扰及噪声时,抽取特征基元困难,且易失误。9.3 图像识别9.3 图像识别Modern Image Analysis 模糊模式识别运用模糊数学的理论和方法解决模式识别问题,适用于分类识别对象本身或要求的识别结果具有模糊性的场合。模糊数学的产生背景模糊数学诞生的标志:1965年美国加利福尼亚大学控制论专家L.A.Zadeh(查德)发表的文章“Fuzzy sets”。精确数学方法:忽略对象的一般特性,着重注意对象的数量、空间形式和几何形状的数学方法。9.3 图像识别9.3 图像识别Modern Image Analysi
9、s精确数学方法的局限性现实世界中的许多现象,用精确数学方法难以解决。例如:著名的问题之一秃头悖论用精确数学方法判断“秃头”:方法:首先给出一个精确的定义,然后推理,最后结论。定义:头发根数 n 时,判决为秃头;否则判决为不秃。即头发根数 n 为判断秃与不秃的界限标准。问题:当头发根数恰好为 n+1,应判决为秃还是不秃?9.3 图像识别9.3 图像识别Modern Image Analysis推理:两种选择(2)承认生活常识:认为仅一根头发之差不会改变秃与不秃的结果,即有n+1根头发者也应是秃头。(1)承认精确方法:判定为不秃。结论:有n根头发的是秃头,有n+1根头发的不是秃头。头发为 n 根者
10、为秃头,头发为 n+1 根者为秃头,头发为 n+k 根者为秃头。那么采用传统的逻辑推理,会得到下面的一些命题:显然不合理结论:头发很多者为秃头。9.3 图像识别9.3 图像识别Modern Image Analysis理论基础:模糊数学主要方法:模糊统计法、二元对比排序法、推理法、模糊集运算规则、模糊矩阵主要优点:由于隶属度函数作为样本与模板间相似程度的度量,故往往能反映整体的与主体的特征,从而允许样本有相当程度的干扰与畸变。主要缺点:准确合理的隶属度函数往往难以建立,故限制了它的应用。9.3 图像识别9.3 图像识别Modern Image Analysis神经网络识别人工神经网络(Arti
11、ficial Neural Networks,ANN)简称神经网络模拟人脑神经细胞的工作特点:单元之间广泛连接 并行分布式的信息存贮与处理 自适应的学习能力9.3 图像识别9.3 图像识别Modern Image Analysis 神经网络识别人们将若干个处理单元(即神经元)通过一定的互联模型连接成一个网络,这个网络通过一定的机制(如误差后项传播)可以模仿人的一些动作过程,以达到识别分类的目的。其区别于其他识别方法的最大特点是它对待识别的对象不要求有太多的分析与了解,具有一定的智能化处理的特点。0 x1x1nx0W1nW1Wy10niityfW x 图9.3.4 一个人工神经元的示例9.3 图
12、像识别9.3 图像识别Modern Image Analysis图9.3.5是常见的三种非线性变换函数 f,其中(a)为强制性函数,(b)为逻辑性函数,(c)是最常见的一种作用函数,称为Sigmoid型。fa+1-1 fa+1-1 fa+1-1(b)阈值逻辑性函数(a)强制性函数(c)S型函数处理单元(神经元)的输入与输出间的关系由下式给出:10niityfW x 式中为第i个输入元素,为从第i个输入与处理单元间的互联权重;为处理单元的内部阈值;y 为处理单元的输出。ixiW 9.3 图像识别9.3 图像识别Modern Image Analysis学习是神经网络最重要的特征之一。学习的实质:同一个训练集的样本输入输出模式反复作用于网络,网络按照一定的训练规则自动调节神经元之间的连接强度或拓扑结构,使实际输出满足期望的要求或者趋于稳定。一旦权重确定,也就确定了用于识别分类的神经网络,也就是分类器。到此,就可以利用该分类器进行图像识别分类。9.3 图像识别9.3 图像识别Modern Image Analysis理论基础:神经生理学、心理学主要方法:BP模型、HOP模型、高阶网主要优点:可处理一些环境信息十分复杂,背景知识不清楚,推理规则不明确的问题。允许样本有较大的缺损、畸变。主要缺点:模型在不断丰富与完善中,目前能识别的模式类还不够多。9.3 图像识别9.3 图像识别