《模式识别课件02-2.pdf》由会员分享,可在线阅读,更多相关《模式识别课件02-2.pdf(4页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、1Lecture 2模式识别系统举例contintuedExample Application of PR in Geophysical Exploration简介:石油的形成与开采石油地球物理勘探原理简介根据地震数据进行储层分析 石油物探中的模式识别问题 地震反射的到达时间 反映地层的构造信息 地震数据的波形、频率成分 与地层的岩性、含油气性质有关储层性质地震数据已知数据实例2实例(续)方案1.监督模式识别提取与储层性质关系密切的地震数据特征 振幅、能量、频率、相位将待研究的储层性质归纳为几个类别用已知井(旁的地震数据)作为训练样本得到某种分类器,对未知位置进行分类预测 问题:训练样本过少训
2、练样本缺乏充分的代表性实例(续)方案2.非监督模式识别提取与储层性质关系密切的地震数据特征对这些数据进行聚类分析考察聚类结果,根据有关地质知识和已知井信息判断结果的合理性,对聚类进行解释根据聚类结果对未知位置进行判断 问题:只能得到定性结果,对已知井的信息利用不充分实例(续)方案3.非监督模式识别+监督模式识别首先进行非监督模式识别分析根据非监督分析结果指定若干虚拟训练样本用已知井和虚拟训练样本组成训练样本集利用监督模式识别再次进行学习和预测实例(续)非监督分析结果实例(续)非监督分析基础上,定量监督学习后的预测结果Sand ThicknessWellsDepth(m)Actualpredic
3、tedTH-A21233-141035.7mknownTH-A51242-142051.9mknownTH-A61239-141621.8mknownTH-A511264-144142.1m42.4mTH-A521261-144045.6m43.8m模式识别属于基于数据的机器学习范畴复杂疾病复杂疾病已知病例数据已知病例数据基因表达数据语音识别结果语音识别结果声音电平数据声音电平数据语料库语料库储层性质地震数据已知数据3PR in cancer genomicsGene expression(from microarray)+clinical dataGene selectionClassifi
4、cation Validation Result:ClassifierRelevant genesPR in cancer genomics-unsupervised learningGene expression Gene selectionClusteringExplanation Result:ClassifierRelevant genes从这些例子我们看到了什么?特征 特征很重要领域知识特征选择特征提取分类和聚类 分类和聚类是模式识别系统的核心依据概率分布模型直接依据数据 监督学习分类器对样本的要求/样本的选择 非监督学习聚类方法结果的解释(统计)模式识别系统的基本组成 有已知样本情
5、况:监督模式识别(supervised PR)无已知样本情况:非监督模式识别(unsupervised PR)信息获取与预处理特征提取与选择分类器设计(训练)分类决策(识别)信息获取与预处理特征提取与选择聚类(自学习)结果解释4处理监督模式识别问题的一般步骤1.分析问题分析问题:看是否属于模式识别问题,把研究的目标抽象为类别;分析问题中哪些(可以观测的)因素可能与分类有关2.原始特征获取原始特征获取:设计实验方法,得到已知样本,对这些样本实施观测和预处理,获取与样本分类有关的观测向量(原始特征)3.特征选择与提取特征选择与提取:为了更好地进行分类,对特征进行必要的提取与选择4.分类器设计分类器设计:利用已知样本设计(训练)某种分类器5.分类分类:对未知样本,实施同样对信息获取与预处理、特征提取与选择,用设计对分类器进行识别处理非监督模式识别问题的一般步骤1.分析问题分析问题:看研究对目标是否可能抽象为若干类别;分析问题中哪些(可以观测的)因素可能与所关心对类别有关2.获取原始观测获取原始观测:观测未知样本,获取原始特征3.特征提取与选择特征提取与选择:进行必要的特征提取与选择4.聚类分析聚类分析:采用某种方法将未知样本分类5.结果解释结果解释:分析所得的类别与所关心的目标之间对关系;如问题需要,用同样的方法对新的未知样本进行分类