《Chap1_模式识别(精品).ppt》由会员分享,可在线阅读,更多相关《Chap1_模式识别(精品).ppt(51页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、模式识别模式识别PATTERN RECOGNITION信息科学与技术学院信息科学与技术学院郝矿荣郝矿荣E-mail: 1教材及参考书目:教材及参考书目:模式识别模式识别 边肇祺、张学工等边肇祺、张学工等 清华大学出版社清华大学出版社图像处理、分析与机器视觉图像处理、分析与机器视觉 Image Processing,Analysis and Machine Vision Milan Sonka 等著等著 人民邮电出版社人民邮电出版社模式识别模式识别PATTERN RECOGNITION2模式识别模式识别PATTERN RECOGNITION考核形式:考核形式:大作业大作业 30%期末考试期末考试
2、 70%3第一章第一章 绪论绪论1.1 模式识别和模式的概念模式识别和模式的概念1.2 模式的描述方法模式的描述方法1.3 模式识别系统模式识别系统1.4 有关模式识别的若干问题有关模式识别的若干问题1.5 本书内容及宗旨本书内容及宗旨4第一章第一章 绪论绪论uu本章要点、难点本章要点、难点本章是这门课的绪言,重点是要弄清本章是这门课的绪言,重点是要弄清“模式识别模式识别”的名词含义,从而弄清这门的名词含义,从而弄清这门课能获得哪方面的知识,学了以后会解决课能获得哪方面的知识,学了以后会解决哪些问题。哪些问题。5第一章第一章 绪论绪论uu重点:重点:1、模式识别的含义,模式的概念、模式识别的含
3、义,模式的概念2、模式的描述方法、模式的描述方法3、模式识别系统的组成、模式识别系统的组成4、模式识别利用训练样本设计分类、模式识别利用训练样本设计分类 器的原理,两种最基本的分类方器的原理,两种最基本的分类方 法的原理法的原理 6第一章第一章 绪论绪论uu难点:难点:1、模式的特征向量表示与结构表示模式的特征向量表示与结构表示2、利用特征向量表示进行分类的基本原理利用特征向量表示进行分类的基本原理3、训练和学习的概念、算法,分类器设计训练和学习的概念、算法,分类器设计 是如何利用训练样本数据提供的信息的是如何利用训练样本数据提供的信息的4、模式识别系统的组成,特征选择与提取模式识别系统的组成
4、,特征选择与提取 的含义和重要性的含义和重要性5、相似性的度量方法相似性的度量方法 71.1 模式识别和模式的概念模式识别和模式的概念uu模式识别的发展历程;模式识别的发展历程;诞生于诞生于20世纪世纪20年代;随着计算机和人工年代;随着计算机和人工智能的兴起,在智能的兴起,在60年代初发展成一门学科。年代初发展成一门学科。uu模式识别的应用领域;模式识别的应用领域;所研究的理论和方法在很多科学和技术领域所研究的理论和方法在很多科学和技术领域中得到了广泛的重视,如人工智能技术及图中得到了广泛的重视,如人工智能技术及图像处理、信号处理、计算机视觉、多媒体技像处理、信号处理、计算机视觉、多媒体技术
5、等多种领域。术等多种领域。天气预报、卫星航空图片的解析天气预报、卫星航空图片的解析 等等81.1 模式识别和模式的概念模式识别和模式的概念uu模式识别研究内容模式识别研究内容 1、研究生物体如何感知对象,属于认知科学、研究生物体如何感知对象,属于认知科学的范畴。的范畴。2、在给定任务下,如何用计算机实现模式识、在给定任务下,如何用计算机实现模式识别的理论和方法,通过数学家、信息学家和别的理论和方法,通过数学家、信息学家和计算科学工作者等计算科学工作者等 3、使机器能做以前只能由人类才能做的事,、使机器能做以前只能由人类才能做的事,具备人所具有的、对各种事物与现象进行分具备人所具有的、对各种事物
6、与现象进行分析、描述与判断的部分能力。析、描述与判断的部分能力。91.1 模式识别和模式的概念模式识别和模式的概念uu模式识别模式识别(Pattern Recognition)uu实际上人类却在日常生活的每个环节,从事实际上人类却在日常生活的每个环节,从事着模式识别的活动着模式识别的活动uu模式识别模式识别就是机器识别,计算机识别,或机就是机器识别,计算机识别,或机器自动识别。器自动识别。如检测病理切片中是否有癌细胞,文字如检测病理切片中是否有癌细胞,文字识别,话语识别,图像中物体识别等等。识别,话语识别,图像中物体识别等等。101.1 模式识别和模式的概念模式识别和模式的概念uu机器识别事物
7、在目前也是很简单与低级的,机器识别事物在目前也是很简单与低级的,因此机器识别事物的能力还很差。因此机器识别事物的能力还很差。uu原因是人们在学习与认识事物中会总结出规原因是人们在学习与认识事物中会总结出规律,并把这些规律性的东西抽象成律,并把这些规律性的东西抽象成“概念概念”。uu但机器目前的抽象能力是很差的。要让机器但机器目前的抽象能力是很差的。要让机器准确地把握事物的本质,弄清分辨事物的关准确地把握事物的本质,弄清分辨事物的关键,从而正确辨别事物,键,从而正确辨别事物,实质上是实质上是要使人能要使人能够研究出好的方法,提出好的算法,从而构够研究出好的方法,提出好的算法,从而构造出好的系统造
8、出好的系统,使机器辨别事物的本领更强。使机器辨别事物的本领更强。111.1 模式识别和模式的概念模式识别和模式的概念uu模式类与模式模式类与模式uu样本样本:所见的具体事物,:所见的具体事物,uu模式模式:而它们所属的事物类别,代表这些事:而它们所属的事物类别,代表这些事物的物的“概念概念”是模式。是模式。uu模式模式:也有另一种说法把所见到的事物称为:也有另一种说法把所见到的事物称为模式,模式,uu模式类模式类:而将它们的归属类别称为模式类。:而将它们的归属类别称为模式类。因此模式这个词。因此模式这个词。121.1 模式识别和模式的概念模式识别和模式的概念uu模式类与模式模式类与模式或者或者
9、模式与样本模式与样本在集合论中是在集合论中是子集与元素之间的关系。子集与元素之间的关系。uu等价类:等价类:当用一定的度量来衡量两个样本,当用一定的度量来衡量两个样本,而找不出它们之间的差别时,它们在这种度而找不出它们之间的差别时,它们在这种度量条件下属于同一个等价类。它们属于量条件下属于同一个等价类。它们属于同一同一子集子集,是,是一个模式一个模式,或,或一个模式类一个模式类。uu而不同的模式类之间应该是可以区分的,它而不同的模式类之间应该是可以区分的,它们之间应有明确的界线。但对实际样本,分们之间应有明确的界线。但对实际样本,分属不同的类别的样本却表现出相同的属性,属不同的类别的样本却表现
10、出相同的属性,因而无法确凿无误地对它们进行区分。因而无法确凿无误地对它们进行区分。131.1 模式识别和模式的概念模式识别和模式的概念uu计算计算是让机器辨别事物的最基本方法,原则是让机器辨别事物的最基本方法,原则上讲是对计算机要分析的事物与作为标准的上讲是对计算机要分析的事物与作为标准的“模板模板”的相似程度进行计算。的相似程度进行计算。uu因此首先通过计算要能从因此首先通过计算要能从度量度量中看出不同事中看出不同事物之间的差异,才能分辨当前要识别的事物物之间的差异,才能分辨当前要识别的事物(称为测试样本称为测试样本)跟哪类事物更接近。跟哪类事物更接近。因此找因此找到有效地度量不同类事物的差
11、异的方法是最到有效地度量不同类事物的差异的方法是最关键的关键的。141.2 模式的描述方法模式的描述方法uu特征:特征:用来决策事物类别的特点、属性就称用来决策事物类别的特点、属性就称之为物体所具有的特征。在模式识别技术中,之为物体所具有的特征。在模式识别技术中,模式就是用它们所具有的特征描述的。对一模式就是用它们所具有的特征描述的。对一种模式与它们的样本来说,将描述它们的所种模式与它们的样本来说,将描述它们的所有特征用一特征集表示有特征用一特征集表示uu其中其中O表示模式或样本的名称,表示模式或样本的名称,则是它们所则是它们所具有的特征。特征包括定性与定量两种描述。具有的特征。特征包括定性与
12、定量两种描述。151.2 模式的描述方法模式的描述方法uu模式的描述方法模式的描述方法:一种是对事物的属性进行度量,属于定量的一种是对事物的属性进行度量,属于定量的表示方法。表示方法。另一种则是对事务所包含的成分进行分析,另一种则是对事务所包含的成分进行分析,称为定性的描述或结构性描述。称为定性的描述或结构性描述。161.2 模式的描述方法模式的描述方法定量的表示方法定量的表示方法uu用各种尺度对事物进行度量。例如对水果进用各种尺度对事物进行度量。例如对水果进行分类,水果的重量、大小、颜色、香味乃行分类,水果的重量、大小、颜色、香味乃至味道等。譬如用水果的重量,近似球体直至味道等。譬如用水果的
13、重量,近似球体直径。径。uu这两个指标按规定的先后排起来,如一只苹这两个指标按规定的先后排起来,如一只苹果重果重0.3斤,直径斤,直径10厘米,则可表示成厘米,则可表示成(0.3,1.0)。uu这种表示方法就称为向量表示法,该向量有这种表示方法就称为向量表示法,该向量有两个分量,每个分量有自己特定的含义。两个分量,每个分量有自己特定的含义。171.2 模式的描述方法模式的描述方法定量的表示方法定量的表示方法定量的表示方法定量的表示方法uu一个苹果的颜色用什么方式表示?一个苹果的颜色用什么方式表示?一个苹果的颜色用什么方式表示?一个苹果的颜色用什么方式表示?如果颜色只能用某些典型色来表示,如红、
14、橙、蓝、如果颜色只能用某些典型色来表示,如红、橙、蓝、如果颜色只能用某些典型色来表示,如红、橙、蓝、如果颜色只能用某些典型色来表示,如红、橙、蓝、绿、紫,那么,这种情况只能用代号表示,如令红绿、紫,那么,这种情况只能用代号表示,如令红绿、紫,那么,这种情况只能用代号表示,如令红绿、紫,那么,这种情况只能用代号表示,如令红为为为为1 1号,橙为号,橙为号,橙为号,橙为2 2号,等等。号,等等。号,等等。号,等等。uu苹果如加上颜色描述,则可用一个三维向量,苹果如加上颜色描述,则可用一个三维向量,苹果如加上颜色描述,则可用一个三维向量,苹果如加上颜色描述,则可用一个三维向量,(0.35,10,1)
15、(0.35,10,1)t t。uu颜色的另一种表示方法,可以用常用的颜色的另一种表示方法,可以用常用的颜色的另一种表示方法,可以用常用的颜色的另一种表示方法,可以用常用的RGBRGB表示。表示。表示。表示。R R,GG,B B就是一个三维向量,如与重量、尺度汇合就是一个三维向量,如与重量、尺度汇合就是一个三维向量,如与重量、尺度汇合就是一个三维向量,如与重量、尺度汇合在一起,就是一个五维的向量。在一起,就是一个五维的向量。在一起,就是一个五维的向量。在一起,就是一个五维的向量。181.2 模式的描述方法模式的描述方法定性的表示方法定性的表示方法uu有一些事物用向量表示是不方便的,例如一有一些事
16、物用向量表示是不方便的,例如一幅景色图像中的房屋用向量描述就不一定方幅景色图像中的房屋用向量描述就不一定方便,对房屋而言,它有屋顶、墙、门窗等组便,对房屋而言,它有屋顶、墙、门窗等组成,各种成分之间又有相互关系,则墙在屋成,各种成分之间又有相互关系,则墙在屋顶之下,门与窗都在墙上等。顶之下,门与窗都在墙上等。uu这种由组成成分与相互关系表示的表示方法,这种由组成成分与相互关系表示的表示方法,最好用结构性的表示,常用的有串、树、图最好用结构性的表示,常用的有串、树、图等。等。191.2 模式的描述方法模式的描述方法uu在本课中,我们主要使用向量表示方法。向在本课中,我们主要使用向量表示方法。向量
17、的每个元素称为特征,该向量也因此称为量的每个元素称为特征,该向量也因此称为特征向量。特征向量。201.2 模式的描述方法模式的描述方法uu图像、像素的定义:图像、像素的定义:图像、像素的定义:图像、像素的定义:在计算机里分析的称为在计算机里分析的称为在计算机里分析的称为在计算机里分析的称为数字图像数字图像数字图像数字图像,它由排列整,它由排列整,它由排列整,它由排列整齐的二维网格组成,分为若干行与若干列,相当于齐的二维网格组成,分为若干行与若干列,相当于齐的二维网格组成,分为若干行与若干列,相当于齐的二维网格组成,分为若干行与若干列,相当于一个二维数组,或称一个二维数组,或称一个二维数组,或称
18、一个二维数组,或称矩阵矩阵矩阵矩阵。我们称每个元素为像素,。我们称每个元素为像素,。我们称每个元素为像素,。我们称每个元素为像素,例如处在第三行第四列的元素的例如处在第三行第四列的元素的例如处在第三行第四列的元素的例如处在第三行第四列的元素的灰度值灰度值灰度值灰度值为为为为155155,则可,则可,则可,则可表示成表示成表示成表示成I(3,4)=155I(3,4)=155。在本门课中都是对向量进行分析的,因此在概在本门课中都是对向量进行分析的,因此在概在本门课中都是对向量进行分析的,因此在概在本门课中都是对向量进行分析的,因此在概念上要把图像也表示成向量,譬如将图像像素一列念上要把图像也表示成
19、向量,譬如将图像像素一列念上要把图像也表示成向量,譬如将图像像素一列念上要把图像也表示成向量,譬如将图像像素一列一列串起来。一列串起来。一列串起来。一列串起来。211.2 模式的描述方法模式的描述方法uu实际上,只要记住向量的运算是建立在各个分量基实际上,只要记住向量的运算是建立在各个分量基实际上,只要记住向量的运算是建立在各个分量基实际上,只要记住向量的运算是建立在各个分量基础上的,例如:础上的,例如:础上的,例如:础上的,例如:uu图像的运算也是按行列来进行,不要弄错行列。图像的运算也是按行列来进行,不要弄错行列。图像的运算也是按行列来进行,不要弄错行列。图像的运算也是按行列来进行,不要弄
20、错行列。uu时域信号:时域信号:时域信号:时域信号:如如如如语音信号语音信号语音信号语音信号这种随时间变化的信号。元这种随时间变化的信号。元这种随时间变化的信号。元这种随时间变化的信号。元素之间的时间先后顺序很重要,因此可用向量的形素之间的时间先后顺序很重要,因此可用向量的形素之间的时间先后顺序很重要,因此可用向量的形素之间的时间先后顺序很重要,因此可用向量的形式将它们排列起来。严格一些,对语音信号进行采式将它们排列起来。严格一些,对语音信号进行采式将它们排列起来。严格一些,对语音信号进行采式将它们排列起来。严格一些,对语音信号进行采样,然后将在不同时刻采样值排列起来,组成向量。样,然后将在不
21、同时刻采样值排列起来,组成向量。样,然后将在不同时刻采样值排列起来,组成向量。样,然后将在不同时刻采样值排列起来,组成向量。221.3 模式识别系统模式识别系统(一一)uu执行模式识别的计算机系统称为执行模式识别的计算机系统称为执行模式识别的计算机系统称为执行模式识别的计算机系统称为模式识别系统模式识别系统模式识别系统模式识别系统。设。设。设。设计人员按需要设计模式识别系统,而该系统被用来计人员按需要设计模式识别系统,而该系统被用来计人员按需要设计模式识别系统,而该系统被用来计人员按需要设计模式识别系统,而该系统被用来执行模式分类的具体任务。执行模式分类的具体任务。执行模式分类的具体任务。执行
22、模式分类的具体任务。uu一般由数据获取,预处理,特征提取选择、分类决一般由数据获取,预处理,特征提取选择、分类决一般由数据获取,预处理,特征提取选择、分类决一般由数据获取,预处理,特征提取选择、分类决策及分类器设计五部分组成。分类器设计在训练过策及分类器设计五部分组成。分类器设计在训练过策及分类器设计五部分组成。分类器设计在训练过策及分类器设计五部分组成。分类器设计在训练过程中完成,利用样本进行训练,确定分类器的具体程中完成,利用样本进行训练,确定分类器的具体程中完成,利用样本进行训练,确定分类器的具体程中完成,利用样本进行训练,确定分类器的具体参数。而分类决策在识别过程中起作用,对待识别参数
23、。而分类决策在识别过程中起作用,对待识别参数。而分类决策在识别过程中起作用,对待识别参数。而分类决策在识别过程中起作用,对待识别的样本进行分类决策。的样本进行分类决策。的样本进行分类决策。的样本进行分类决策。231.3 模式识别系统模式识别系统(一一)uu汽车车牌识别的例子。这个例子表示了一个汽车车汽车车牌识别的例子。这个例子表示了一个汽车车汽车车牌识别的例子。这个例子表示了一个汽车车汽车车牌识别的例子。这个例子表示了一个汽车车牌识别的全过程。牌识别的全过程。牌识别的全过程。牌识别的全过程。241.3 模式识别系统模式识别系统(二二)uu成功的车牌识别系统有着非常广泛的应用前景,成功的车牌识别
24、系统有着非常广泛的应用前景,成功的车牌识别系统有着非常广泛的应用前景,成功的车牌识别系统有着非常广泛的应用前景,例如公路上的自动收费站,十字路口的违章车例如公路上的自动收费站,十字路口的违章车例如公路上的自动收费站,十字路口的违章车例如公路上的自动收费站,十字路口的违章车辆监视等等。辆监视等等。辆监视等等。辆监视等等。uu目前的车牌识别系统大都是按照以上的流程。目前的车牌识别系统大都是按照以上的流程。目前的车牌识别系统大都是按照以上的流程。目前的车牌识别系统大都是按照以上的流程。这个流程又可以在整体上划分为两大部分这个流程又可以在整体上划分为两大部分这个流程又可以在整体上划分为两大部分这个流程
25、又可以在整体上划分为两大部分车牌的提取和定位,以及字符识别部分。车牌的提取和定位,以及字符识别部分。车牌的提取和定位,以及字符识别部分。车牌的提取和定位,以及字符识别部分。uu我们将针对每一个模块,具体说明车牌识别的我们将针对每一个模块,具体说明车牌识别的我们将针对每一个模块,具体说明车牌识别的我们将针对每一个模块,具体说明车牌识别的过程。过程。过程。过程。251.3 模式识别系统模式识别系统(二二)uu图图图图1 1 车牌车牌车牌车牌识别系统识别系统识别系统识别系统(a)a)原始图像,原始图像,原始图像,原始图像,(b)b)特征提取特征提取特征提取特征提取结果结果结果结果 (c)c)粗略定位
26、粗略定位粗略定位粗略定位 (d)d)精细定位精细定位精细定位精细定位 (e)e)确定牌照确定牌照确定牌照确定牌照类型类型类型类型 (f)f)车牌号码车牌号码车牌号码车牌号码输出输出输出输出261.3 模式识别系统模式识别系统(三三)车牌识别系统车牌识别系统车牌识别系统车牌识别系统车牌定位模块车牌定位模块车牌定位模块车牌定位模块uu目的是从整幅图像中定位出车牌的精确位置。主目的是从整幅图像中定位出车牌的精确位置。主目的是从整幅图像中定位出车牌的精确位置。主目的是从整幅图像中定位出车牌的精确位置。主要利用的信息是车牌部分的纹理分布、水平和竖要利用的信息是车牌部分的纹理分布、水平和竖要利用的信息是车
27、牌部分的纹理分布、水平和竖要利用的信息是车牌部分的纹理分布、水平和竖直两个方向上的边缘。直两个方向上的边缘。直两个方向上的边缘。直两个方向上的边缘。uu在车牌部分,边缘分布比较密集,可以利用这一在车牌部分,边缘分布比较密集,可以利用这一在车牌部分,边缘分布比较密集,可以利用这一在车牌部分,边缘分布比较密集,可以利用这一点提取出候选的车牌区域,在图中用方框标出。点提取出候选的车牌区域,在图中用方框标出。点提取出候选的车牌区域,在图中用方框标出。点提取出候选的车牌区域,在图中用方框标出。粗略定位的结果往往不是很准,我们还可以利用粗略定位的结果往往不是很准,我们还可以利用粗略定位的结果往往不是很准,
28、我们还可以利用粗略定位的结果往往不是很准,我们还可以利用颜色的连续性信息对定位的结果进行修正。之后颜色的连续性信息对定位的结果进行修正。之后颜色的连续性信息对定位的结果进行修正。之后颜色的连续性信息对定位的结果进行修正。之后输出的就是候选的车牌位置。输出的就是候选的车牌位置。输出的就是候选的车牌位置。输出的就是候选的车牌位置。uu上述位置中,只有一个是真正的车牌。而究竟哪上述位置中,只有一个是真正的车牌。而究竟哪上述位置中,只有一个是真正的车牌。而究竟哪上述位置中,只有一个是真正的车牌。而究竟哪一个是对的,要到字符识别阶段才能有结果。一个是对的,要到字符识别阶段才能有结果。一个是对的,要到字符
29、识别阶段才能有结果。一个是对的,要到字符识别阶段才能有结果。271.3 模式识别系统模式识别系统(三三)车牌识别系统车牌识别系统车牌识别系统车牌识别系统uu通过输出评价,去掉伪车牌区域,只把最正确车通过输出评价,去掉伪车牌区域,只把最正确车通过输出评价,去掉伪车牌区域,只把最正确车通过输出评价,去掉伪车牌区域,只把最正确车牌的结果作为最终结果输出出来。牌的结果作为最终结果输出出来。牌的结果作为最终结果输出出来。牌的结果作为最终结果输出出来。uu字符识别分两部分,其中字符分割要把车牌中的字符识别分两部分,其中字符分割要把车牌中的字符识别分两部分,其中字符分割要把车牌中的字符识别分两部分,其中字符
30、分割要把车牌中的一个个字符逐一切分开,下一步的识别对每一个一个个字符逐一切分开,下一步的识别对每一个一个个字符逐一切分开,下一步的识别对每一个一个个字符逐一切分开,下一步的识别对每一个字符分别处理。字符分别处理。字符分别处理。字符分别处理。uu分割的方法就是利用灰度图像往水平方向的投影。分割的方法就是利用灰度图像往水平方向的投影。分割的方法就是利用灰度图像往水平方向的投影。分割的方法就是利用灰度图像往水平方向的投影。可以很好的将字符分割开来。可以很好的将字符分割开来。可以很好的将字符分割开来。可以很好的将字符分割开来。uu对这个区域是不是车牌区域作个评价。如果像对这个区域是不是车牌区域作个评价
31、。如果像对这个区域是不是车牌区域作个评价。如果像对这个区域是不是车牌区域作个评价。如果像(e)e)中左图那样字体太宽,说明是其它的字符。中左图那样字体太宽,说明是其它的字符。中左图那样字体太宽,说明是其它的字符。中左图那样字体太宽,说明是其它的字符。281.3 模式识别系统模式识别系统(三三)车牌识别系统车牌识别系统车牌识别系统车牌识别系统的的的的uu字符识别的方法:神经元网络,字符识别的方法:神经元网络,字符识别的方法:神经元网络,字符识别的方法:神经元网络,PCAPCA,特征提取特征提取特征提取特征提取及匹配等,模板匹配和特征提取是比较常用。及匹配等,模板匹配和特征提取是比较常用。及匹配等
32、,模板匹配和特征提取是比较常用。及匹配等,模板匹配和特征提取是比较常用。uu其中模板匹配是把样本字符与输入的待识别字符其中模板匹配是把样本字符与输入的待识别字符其中模板匹配是把样本字符与输入的待识别字符其中模板匹配是把样本字符与输入的待识别字符作匹配,如果两个字符很像,说明匹配成功,把作匹配,如果两个字符很像,说明匹配成功,把作匹配,如果两个字符很像,说明匹配成功,把作匹配,如果两个字符很像,说明匹配成功,把这个模板的对应字符作为输出结果。这个模板的对应字符作为输出结果。这个模板的对应字符作为输出结果。这个模板的对应字符作为输出结果。uu而特征提取的方法是对样本和待测图像都先提取而特征提取的方
33、法是对样本和待测图像都先提取而特征提取的方法是对样本和待测图像都先提取而特征提取的方法是对样本和待测图像都先提取一些明显的特征,例如对一些明显的特征,例如对一些明显的特征,例如对一些明显的特征,例如对“5”“5”和和和和“9”“9”考虑其右考虑其右考虑其右考虑其右上角是否封口,这样作的好处是可以用维数较低上角是否封口,这样作的好处是可以用维数较低上角是否封口,这样作的好处是可以用维数较低上角是否封口,这样作的好处是可以用维数较低的向量来描述图像,而且这些特征都是有代表性,的向量来描述图像,而且这些特征都是有代表性,的向量来描述图像,而且这些特征都是有代表性,的向量来描述图像,而且这些特征都是有
34、代表性,可以用来区分不同样本的。可以用来区分不同样本的。可以用来区分不同样本的。可以用来区分不同样本的。291.3 模式识别系统模式识别系统(三三)车牌识别系统车牌识别系统车牌识别系统车牌识别系统不足之处不足之处不足之处不足之处uu特征提取的方法不足之处是特征需要手工设计,特征提取的方法不足之处是特征需要手工设计,特征提取的方法不足之处是特征需要手工设计,特征提取的方法不足之处是特征需要手工设计,工作量较大。工作量较大。工作量较大。工作量较大。uuPCAPCA(PrincipalComponentsAnalysis)方法在一定方法在一定方法在一定方法在一定程度上解决了这个问题。它可以从大量样本
35、中训程度上解决了这个问题。它可以从大量样本中训程度上解决了这个问题。它可以从大量样本中训程度上解决了这个问题。它可以从大量样本中训练得到每一类的特点。但是它也有不足之处,就练得到每一类的特点。但是它也有不足之处,就练得到每一类的特点。但是它也有不足之处,就练得到每一类的特点。但是它也有不足之处,就是样本的对齐是样本的对齐是样本的对齐是样本的对齐(align)align)问题,如果训练时没有对齐,问题,如果训练时没有对齐,问题,如果训练时没有对齐,问题,如果训练时没有对齐,对训练结果会有影响,而如果识别时没有对齐,对训练结果会有影响,而如果识别时没有对齐,对训练结果会有影响,而如果识别时没有对齐
36、,对训练结果会有影响,而如果识别时没有对齐,也会产生错误的识别结果。也会产生错误的识别结果。也会产生错误的识别结果。也会产生错误的识别结果。301.3 模式识别系统模式识别系统(四四)信息获取信息获取信息获取信息获取uu计算机都只能处理某种形式的电信号,而待识别计算机都只能处理某种形式的电信号,而待识别计算机都只能处理某种形式的电信号,而待识别计算机都只能处理某种形式的电信号,而待识别的样本大都是非电信息,例如癌细胞病理切片,的样本大都是非电信息,例如癌细胞病理切片,的样本大都是非电信息,例如癌细胞病理切片,的样本大都是非电信息,例如癌细胞病理切片,语音信号,待识别文本,图像等。语音信号,待识
37、别文本,图像等。语音信号,待识别文本,图像等。语音信号,待识别文本,图像等。uu将以各种不同形式表现的信息通过传感器转换成将以各种不同形式表现的信息通过传感器转换成将以各种不同形式表现的信息通过传感器转换成将以各种不同形式表现的信息通过传感器转换成电信号。如用话筒将声音信号转换成电信号,表电信号。如用话筒将声音信号转换成电信号,表电信号。如用话筒将声音信号转换成电信号,表电信号。如用话筒将声音信号转换成电信号,表现出电压现出电压现出电压现出电压(电流电流电流电流)随时间变化的复杂波形。景物信随时间变化的复杂波形。景物信随时间变化的复杂波形。景物信随时间变化的复杂波形。景物信息在摄像机靶面成像并
38、转换成二维的象素矩阵,息在摄像机靶面成像并转换成二维的象素矩阵,息在摄像机靶面成像并转换成二维的象素矩阵,息在摄像机靶面成像并转换成二维的象素矩阵,每个像素每个像素每个像素每个像素(矩阵元素矩阵元素矩阵元素矩阵元素)的电信号与物体表面反射的的电信号与物体表面反射的的电信号与物体表面反射的的电信号与物体表面反射的光强或颜色信息呈现函数关系。光强或颜色信息呈现函数关系。光强或颜色信息呈现函数关系。光强或颜色信息呈现函数关系。uu信号获取环节主要是由不同形式的传感器构成,信号获取环节主要是由不同形式的传感器构成,信号获取环节主要是由不同形式的传感器构成,信号获取环节主要是由不同形式的传感器构成,实现
39、信息获取与信息在不同媒体之间的转换。实现信息获取与信息在不同媒体之间的转换。实现信息获取与信息在不同媒体之间的转换。实现信息获取与信息在不同媒体之间的转换。311.3 模式识别系统模式识别系统(四四)预处理预处理预处理预处理uu预处理主要是指去除所获取信息中的噪声,增强预处理主要是指去除所获取信息中的噪声,增强预处理主要是指去除所获取信息中的噪声,增强预处理主要是指去除所获取信息中的噪声,增强有用的信息,及一切必要的使信息纯化的处理过有用的信息,及一切必要的使信息纯化的处理过有用的信息,及一切必要的使信息纯化的处理过有用的信息,及一切必要的使信息纯化的处理过程。程。程。程。uu这个环节内容很广
40、泛,与要解决的具体问题有关,这个环节内容很广泛,与要解决的具体问题有关,这个环节内容很广泛,与要解决的具体问题有关,这个环节内容很广泛,与要解决的具体问题有关,例如,从图象中将汽车车牌的号码识别出来,就例如,从图象中将汽车车牌的号码识别出来,就例如,从图象中将汽车车牌的号码识别出来,就例如,从图象中将汽车车牌的号码识别出来,就需要先将车牌从图像中找出来,再对车牌进行划需要先将车牌从图像中找出来,再对车牌进行划需要先将车牌从图像中找出来,再对车牌进行划需要先将车牌从图像中找出来,再对车牌进行划分,将每个数字分别划分开。做到这一步以后,分,将每个数字分别划分开。做到这一步以后,分,将每个数字分别划
41、分开。做到这一步以后,分,将每个数字分别划分开。做到这一步以后,才能对每个数字进行识别。以上工作都应该在预才能对每个数字进行识别。以上工作都应该在预才能对每个数字进行识别。以上工作都应该在预才能对每个数字进行识别。以上工作都应该在预处理阶段完成。处理阶段完成。处理阶段完成。处理阶段完成。321.3 模式识别系统模式识别系统(四四)特征选择和提取特征选择和提取特征选择和提取特征选择和提取uu测量空间测量空间测量空间测量空间:由所使用的量测仪器或传感器获取的:由所使用的量测仪器或传感器获取的:由所使用的量测仪器或传感器获取的:由所使用的量测仪器或传感器获取的原始数据组成的空间。因此特征的选择与提取
42、模原始数据组成的空间。因此特征的选择与提取模原始数据组成的空间。因此特征的选择与提取模原始数据组成的空间。因此特征的选择与提取模块的功能是:对所获取的信息实现从测量空间到块的功能是:对所获取的信息实现从测量空间到块的功能是:对所获取的信息实现从测量空间到块的功能是:对所获取的信息实现从测量空间到特征空间的转换。特征空间的转换。特征空间的转换。特征空间的转换。uu特征提取模块将原始量测数据转换成有效方式表特征提取模块将原始量测数据转换成有效方式表特征提取模块将原始量测数据转换成有效方式表特征提取模块将原始量测数据转换成有效方式表示的信息,从而使分类器能根据这些信息决定样示的信息,从而使分类器能根
43、据这些信息决定样示的信息,从而使分类器能根据这些信息决定样示的信息,从而使分类器能根据这些信息决定样本的类别。前面说过待识别的样本及模式都是用本的类别。前面说过待识别的样本及模式都是用本的类别。前面说过待识别的样本及模式都是用本的类别。前面说过待识别的样本及模式都是用特征进行描述的,识别与训练都是在特征空间中特征进行描述的,识别与训练都是在特征空间中特征进行描述的,识别与训练都是在特征空间中特征进行描述的,识别与训练都是在特征空间中进行的。进行的。进行的。进行的。331.3 模式识别系统模式识别系统(四四)特征选择和提取特征选择和提取特征选择和提取特征选择和提取-举例举例举例举例uu印刷体数字
44、大多通过扫描仪输印刷体数字大多通过扫描仪输印刷体数字大多通过扫描仪输印刷体数字大多通过扫描仪输入,或从图像中获取。这样一入,或从图像中获取。这样一入,或从图像中获取。这样一入,或从图像中获取。这样一来,一个数字往往用一个来,一个数字往往用一个来,一个数字往往用一个来,一个数字往往用一个NMNM的数组表示。如果的数组表示。如果的数组表示。如果的数组表示。如果N N5 5,MM7 7,则一个数字就用则一个数字就用则一个数字就用则一个数字就用5757共共共共3535个网格是黑是白来表示。个网格是黑是白来表示。个网格是黑是白来表示。个网格是黑是白来表示。如令是黑为如令是黑为如令是黑为如令是黑为“1”“
45、1”,是白为,是白为,是白为,是白为“0”“0”,那么一个数字就可用,那么一个数字就可用,那么一个数字就可用,那么一个数字就可用3535维的二进制向量表示。这就维的二进制向量表示。这就维的二进制向量表示。这就维的二进制向量表示。这就是典型的特征向量表示法。是典型的特征向量表示法。是典型的特征向量表示法。是典型的特征向量表示法。341.3 模式识别系统模式识别系统(五五)分类决策分类决策分类决策分类决策uu模式识别系统工作有两模式识别系统工作有两模式识别系统工作有两模式识别系统工作有两种方式,一种是种方式,一种是种方式,一种是种方式,一种是训练方训练方训练方训练方式式式式,另一是,另一是,另一是
46、,另一是分类决策方分类决策方分类决策方分类决策方式式式式。训练方式是指在已。训练方式是指在已。训练方式是指在已。训练方式是指在已确定的特征空间中,对确定的特征空间中,对确定的特征空间中,对确定的特征空间中,对作为训练样本的量测数作为训练样本的量测数作为训练样本的量测数作为训练样本的量测数据进行特征选择与提取,据进行特征选择与提取,据进行特征选择与提取,据进行特征选择与提取,得到它们在特征空间的得到它们在特征空间的得到它们在特征空间的得到它们在特征空间的分布,依据这些分布决分布,依据这些分布决分布,依据这些分布决分布,依据这些分布决定分类器的具体参数。定分类器的具体参数。定分类器的具体参数。定分
47、类器的具体参数。351.3 模式识别系统模式识别系统(五五)分类决策分类决策分类决策分类决策-分类决策方式分类决策方式分类决策方式分类决策方式。uu由事物的属性得到它的特征向量,因此它在特征由事物的属性得到它的特征向量,因此它在特征由事物的属性得到它的特征向量,因此它在特征由事物的属性得到它的特征向量,因此它在特征空间中表示成一个点,称为空间中表示成一个点,称为空间中表示成一个点,称为空间中表示成一个点,称为数据点数据点数据点数据点。uu在特征空间的分布中往往表现出同类事物的特征在特征空间的分布中往往表现出同类事物的特征在特征空间的分布中往往表现出同类事物的特征在特征空间的分布中往往表现出同类
48、事物的特征向量聚集在一起,而不同事物则分别占据不同的向量聚集在一起,而不同事物则分别占据不同的向量聚集在一起,而不同事物则分别占据不同的向量聚集在一起,而不同事物则分别占据不同的区域。因此待识别的事物,如果它的特征向量出区域。因此待识别的事物,如果它的特征向量出区域。因此待识别的事物,如果它的特征向量出区域。因此待识别的事物,如果它的特征向量出现在某一类事物经常出现或可能出现的区域内,现在某一类事物经常出现或可能出现的区域内,现在某一类事物经常出现或可能出现的区域内,现在某一类事物经常出现或可能出现的区域内,该事物就被识别为该类事物。该事物就被识别为该类事物。该事物就被识别为该类事物。该事物就
49、被识别为该类事物。uu在特征空间中哪个区域是某类事物典型所在区域在特征空间中哪个区域是某类事物典型所在区域在特征空间中哪个区域是某类事物典型所在区域在特征空间中哪个区域是某类事物典型所在区域需要用数学式子划定,满足这种数学式子与否就需要用数学式子划定,满足这种数学式子与否就需要用数学式子划定,满足这种数学式子与否就需要用数学式子划定,满足这种数学式子与否就成为分类决策的依据。成为分类决策的依据。成为分类决策的依据。成为分类决策的依据。uu如何确定这些数学式子就是分类器设计的任务。如何确定这些数学式子就是分类器设计的任务。如何确定这些数学式子就是分类器设计的任务。如何确定这些数学式子就是分类器设
50、计的任务。361.3 模式识别系统模式识别系统(五五)uu本课程将着重围绕模式识别的基本原理及分类器本课程将着重围绕模式识别的基本原理及分类器本课程将着重围绕模式识别的基本原理及分类器本课程将着重围绕模式识别的基本原理及分类器设计的基本问题进行讨论。设计的基本问题进行讨论。设计的基本问题进行讨论。设计的基本问题进行讨论。uu在许多应用领域中模式识别并不一定作为独立的在许多应用领域中模式识别并不一定作为独立的在许多应用领域中模式识别并不一定作为独立的在许多应用领域中模式识别并不一定作为独立的环节存在。常见的独立工作的模式识别系统有语环节存在。常见的独立工作的模式识别系统有语环节存在。常见的独立工