《计算机科学理论模式识别精选文档.ppt》由会员分享,可在线阅读,更多相关《计算机科学理论模式识别精选文档.ppt(29页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、计算机科学理论模式计算机科学理论模式识别课件识别课件本讲稿第一页,共二十九页课程对象信息工程专业本科生的专业课信息工程专业本科生的专业课学院硕士研究生的学位课学院硕士研究生的学位课 学院博士研究生的必修课之一学院博士研究生的必修课之一本讲稿第二页,共二十九页学习方法着重理解着重理解基本概念基本概念基本方法基本方法算法原理算法原理注重理论与实践紧密结合注重理论与实践紧密结合本讲稿第三页,共二十九页基本要求基本:基本:完成课程学习,通过考试,获得学分。完成课程学习,通过考试,获得学分。提高:提高:能够将所学知识和内容用于课题研究,能够将所学知识和内容用于课题研究,解决实际问题。解决实际问题。飞跃:
2、飞跃:通过模式识别的学习,改进思维方式,通过模式识别的学习,改进思维方式,为将来的工作打好基础,终身受益。为将来的工作打好基础,终身受益。本讲稿第四页,共二十九页课程内容及安排第一章第一章 引论引论 (2学时学时)第二章第二章 聚类分析聚类分析 (4学时学时)第三章第三章 判别域代数界面方程法判别域代数界面方程法 (4学时学时)第四章第四章 统计判决统计判决 (4学时学时)第五章第五章 统计决策中的学习与估计(统计决策中的学习与估计(4学时学时)第六章第六章 最近邻方法最近邻方法 (2学时学时)第七章第七章 特征提取与选择特征提取与选择(2学时学时)复习复习 (2学时学时)实验实验 上机实验上
3、机实验 (8学时学时)作业作业 每章课后布置习题每章课后布置习题考核考核 笔试笔试(70%)+实验实验(20%)+作业作业(10%)本讲稿第五页,共二十九页教材及参考教材教材及参考教材教材教材孙即祥,孙即祥,现代模式识别现代模式识别,国防科技大学出,国防科技大学出版社,版社,2002.12002.1参考教材参考教材J.P.Marques de Sa,J.P.Marques de Sa,模式识别模式识别-原理、方法及原理、方法及应用应用,清华大学出版社,清华大学出版社,2002.11 2002.11 边肇祺等,边肇祺等,模式识别模式识别(第二版)清华大(第二版)清华大学出版社学出版社 2000.
4、12000.1Sergios Theodoridis,Sergios Theodoridis,李晶皎等译,模式识李晶皎等译,模式识别(第三版),电子工业出版社,别(第三版),电子工业出版社,20062006本讲稿第六页,共二十九页第一章第一章引引 论论1.1 模式和模式识别模式和模式识别1.1.1 1.1.1 模式和模式识别的概念模式和模式识别的概念p识别是人类的基本行为识别是人类的基本行为p模式识别(模式识别(Pattern RecognitionPattern Recognition)使用计使用计算机来辨别事物。算机来辨别事物。机器识别,计算机识别,机机器识别,计算机识别,机器自动识别。器
5、自动识别。本讲稿第七页,共二十九页1.2 模式识别系统模式识别系统本讲稿第八页,共二十九页概 念样本样本(Sample)Sample):一个具体的研究(客观)对象。:一个具体的研究(客观)对象。如某人写的一个汉字,一幅图片等。如某人写的一个汉字,一幅图片等。模式模式(PatternPattern):对客体(研究对象)特征的):对客体(研究对象)特征的描述(定量的或结构的描述),是取自客观世界描述(定量的或结构的描述),是取自客观世界的某一样本的测量值的集合(或综合)。的某一样本的测量值的集合(或综合)。模式类模式类(ClassClass):):具有某些共同特性的模式的具有某些共同特性的模式的集
6、合。集合。本讲稿第九页,共二十九页特征矢量:特征矢量:设一个研究对象的设一个研究对象的 个特征量测量值分别个特征量测量值分别为为 ,我们将它们作为一个整体来我们将它们作为一个整体来考虑考虑,让它们构成一个让它们构成一个 维特征矢量维特征矢量 。特征空间特征空间:各种不同取值的特征矢量的全体构成了各种不同取值的特征矢量的全体构成了 维特征空间。维特征空间。注:注:特征矢量就是特征空间中的一个点。特征矢量就是特征空间中的一个点。(颜色(绿颜色(绿/红)红),似圆度似圆度)本讲稿第十页,共二十九页颜色(绿颜色(绿/红)红)似圆度似圆度模式识别:模式识别:确定一个样本的类别属性(模式类)确定一个样本的
7、类别属性(模式类)的过程,即把某一样本归属于多个类型中的某的过程,即把某一样本归属于多个类型中的某个类型。模式分类的过程。个类型。模式分类的过程。本讲稿第十一页,共二十九页1.1.2 1.1.2 机器与人类识别事物原理的比较机器与人类识别事物原理的比较人类:人类:具有抽象抽象概念的能力具有抽象抽象概念的能力总结规律,抽象出概念总结规律,抽象出概念机器:机器:缺乏抽象能力缺乏抽象能力基本方法是计算基本方法是计算本讲稿第十二页,共二十九页1.1.3 1.1.3 模式识别技术的应用领域模式识别技术的应用领域生物学生物学p自动细胞学、染色体特性研究、遗传研究自动细胞学、染色体特性研究、遗传研究天文学天
8、文学p天文望远镜图像分析、自动光谱学天文望远镜图像分析、自动光谱学经济学经济学p股票交易预测、企业行为分析股票交易预测、企业行为分析医学医学p心电图分析、脑电图分析、医学图像分析心电图分析、脑电图分析、医学图像分析本讲稿第十三页,共二十九页文字识别(文字识别(Character Recognition)pOCR(Optical Character Recognition)智能交通(智能交通(Intelligent Traffic)p车牌、车型车牌、车型语音识别(语音识别(Speech recognition)p翻译机,身份识别等翻译机,身份识别等目标识别目标识别pATR(Automaic Ta
9、rget Recognition)本讲稿第十四页,共二十九页(1 1)确定患者的病症:测量体温、血压,化)确定患者的病症:测量体温、血压,化验血沉,询问临床表现(验血沉,询问临床表现(模式采集模式采集););(2 2)医生运用医学知识和个人经验()医生运用医学知识和个人经验(分类判分类判决规则决规则),根据主要病症(),根据主要病症(特征提取特征提取/选择选择),),作出诊断(作出诊断(分类判决分类判决):该患者():该患者(模式样本模式样本)患了何种疾病(患了何种疾病(模式类模式类)。)。例子1:诊断1.2 模式识别系统模式识别系统本讲稿第十五页,共二十九页1.2 模式识别系统模式识别系统数
10、据采集数据采集特征提取特征提取正确率正确率测试测试数据采集数据采集特征提取特征提取改进分类识改进分类识别规则别规则二次特征二次特征提取与选择提取与选择分类分类识别识别改进采集改进采集提取方法提取方法二次特征提二次特征提取与选择取与选择改进特征提改进特征提取与选择取与选择制定改进分类制定改进分类识别规则识别规则待识待识对象对象训练训练样本样本人工人工干预干预识别结果识别结果本讲稿第十六页,共二十九页例子例子2:苹果和香蕉的分类:苹果和香蕉的分类颜色(绿颜色(绿/红)红)似圆度似圆度1.2 模式识别系统模式识别系统本讲稿第十七页,共二十九页18纸币识别器对纸币按面额进行分类纸币识别器对纸币按面额进
11、行分类 面额面额例子例子3 3:纸币识别系统:纸币识别系统5元10元20元50元100元本讲稿第十八页,共二十九页19长度长度(mm)mm)宽度宽度(mm)mm)5 5元元13613663631010元元14114170702020元元14614670705050元元1511517070100100元元1561567777例子3:纸币识别系统本讲稿第十九页,共二十九页20磁性磁性金属条位置金属条位置(大约大约)5 5元元有有 54/82 54/821010元元有有 54/87 54/872020元元有有 57/89 57/895050元元有有 60/91 60/91100100元元有有 63/
12、93 63/93例子3:纸币识别系统本讲稿第二十页,共二十九页21数据采集、特征提取:数据采集、特征提取:长度、宽度、磁性、磁性的位置等等长度、宽度、磁性、磁性的位置等等 特征选择:特征选择:长度、位置长度、位置分类识别:分类识别:确定纸币的面额确定纸币的面额例子3:纸币识别系统本讲稿第二十一页,共二十九页各类空间(Space)的概念对象空间对象空间模式空间模式空间特征空间特征空间类型空间类型空间模式采集:从客观世界(对象空间)到模式采集:从客观世界(对象空间)到模式空间的过程称为模式采集。模式空间的过程称为模式采集。特征提取和特征选择:由模式空间到特特征提取和特征选择:由模式空间到特征空间的
13、变换和选择。征空间的变换和选择。类型判别:特征空间到类型空间所作的类型判别:特征空间到类型空间所作的操作。操作。1.3 特征矢量和特征空间特征矢量和特征空间所有样本观测数据构成的空间所有样本观测数据构成的空间本讲稿第二十二页,共二十九页1.3 特征矢量和特征空间特征矢量和特征空间本讲稿第二十三页,共二十九页1.4 模式识别方法模式识别方法统计判决统计判决句法结构句法结构模糊判决模糊判决逻辑推理逻辑推理神经网络神经网络本讲稿第二十四页,共二十九页(1)统计判决理论基础:概率论,数理统计理论基础:概率论,数理统计模式描述方法:特征向量模式描述方法:特征向量主要方法主要方法几何分类:线性分类,非线性
14、分类几何分类:线性分类,非线性分类统计分类:统计分类:Bayes决策决策无教师的分类:聚类分析无教师的分类:聚类分析主要优点主要优点1)比较成熟)比较成熟2)能考虑干扰噪声等影响)能考虑干扰噪声等影响3)识别模式基元能力强)识别模式基元能力强主要缺点主要缺点1)对结构复杂的模式抽取特征困难)对结构复杂的模式抽取特征困难2)不能反映模式的结构特征,难以描述模式的性质)不能反映模式的结构特征,难以描述模式的性质3)难以从整体角度考虑识别问题)难以从整体角度考虑识别问题本讲稿第二十五页,共二十九页(2)句法结构)句法结构理论基础:形式语言,自动机技术理论基础:形式语言,自动机技术模式描述方法:符号串
15、,树,图模式描述方法:符号串,树,图模式判定:是一种语言,用一个文法表示一个类,模式判定:是一种语言,用一个文法表示一个类,m类就有类就有m个个文法,然后判定未知模式遵循哪一个文法。文法,然后判定未知模式遵循哪一个文法。主要优点主要优点1)识别方便,可以从简单的基元开始,由简至繁。)识别方便,可以从简单的基元开始,由简至繁。2)能反映模式的结构特征,能描述模式的性质。)能反映模式的结构特征,能描述模式的性质。3)对图象畸变的抗干扰能力较强。)对图象畸变的抗干扰能力较强。主要缺点主要缺点当存在干扰及噪声时,抽取特征基元困难,且易失误。当存在干扰及噪声时,抽取特征基元困难,且易失误。本讲稿第二十六
16、页,共二十九页(3)模糊判决理论基础:模糊数学理论基础:模糊数学模式描述方法:模糊集合模式描述方法:模糊集合 A=(a,a),(b,b),.(n,n),模式判定:是一种集合运算。用隶属度将模糊集合划分为若干子集,模式判定:是一种集合运算。用隶属度将模糊集合划分为若干子集,m类就有类就有m个子集,然后根据择近原则分类。个子集,然后根据择近原则分类。主要优点主要优点由于隶属度函数作为样本与模板间相似程度的度量,故往往能反映整体由于隶属度函数作为样本与模板间相似程度的度量,故往往能反映整体的与主体的特征,从而允许样本有相当程度的干扰与畸变。的与主体的特征,从而允许样本有相当程度的干扰与畸变。主要缺点
17、主要缺点准确合理的隶属度函数往往难以建立,故限制了它的应用。准确合理的隶属度函数往往难以建立,故限制了它的应用。本讲稿第二十七页,共二十九页(4)逻辑推理理论基础:演绎逻辑,布尔代数理论基础:演绎逻辑,布尔代数模式描述方法:字符串表示的事实模式描述方法:字符串表示的事实模式判定:是一种布尔运算。从事实出发运用一系列规则,推模式判定:是一种布尔运算。从事实出发运用一系列规则,推理得到不同结果,理得到不同结果,m个类就有个类就有m个结果。个结果。主要优点主要优点已建立了关于知识表示及组织,目标搜索及匹配的完整体系。已建立了关于知识表示及组织,目标搜索及匹配的完整体系。对需要众多规则的推理达到识别目
18、标确认的问题,有很好的效对需要众多规则的推理达到识别目标确认的问题,有很好的效果。果。缺点缺点当样本有缺损,背景不清晰,规则不明确甚至有歧义时,效果不好。当样本有缺损,背景不清晰,规则不明确甚至有歧义时,效果不好。本讲稿第二十八页,共二十九页(5)神经网络理论基础:神经生理学,心理学理论基础:神经生理学,心理学模式描述方法:以不同活跃度表示的输入节点集模式描述方法:以不同活跃度表示的输入节点集模式判定:是一个非线性动态系统。通过对样本的学习建立记忆,然模式判定:是一个非线性动态系统。通过对样本的学习建立记忆,然后将未知模式判决为其最接近的记忆。后将未知模式判决为其最接近的记忆。主要优点主要优点可处理一些环境信息十分复杂,背景知识不清楚,推理规则不可处理一些环境信息十分复杂,背景知识不清楚,推理规则不明确的问题。允许样本有较大的缺损、畸变。明确的问题。允许样本有较大的缺损、畸变。主要缺点主要缺点模型在不断丰富与完善中,目前能识别的模式类还不够多。模型在不断丰富与完善中,目前能识别的模式类还不够多。本讲稿第二十九页,共二十九页