《统计模式识别方法在录井油气评价中的应用_杜红.pdf》由会员分享,可在线阅读,更多相关《统计模式识别方法在录井油气评价中的应用_杜红.pdf(3页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、?收稿日期 20060705?作者简介 杜红(1964),女,1986 年大学毕业,硕士,副教授,现在主要从事计算机应用与信息处理工作。统计模式识别方法在录井油气评价中的应用?杜?红,刘强国?(长江大学电子信息学院,湖北 荆州 434023)摘要 深入地研究了综合录井的特征参数,对其进行了降维映射处理。提出了利用窗函数法和近邻法求录井参数的特征分布,并以此来构造概率密度分布函数;应用统计模式识别的贝叶斯判别决策方法训练分类的有关参数,确定了基于线性窗函数的贝叶斯方法和基于独立近邻原则的贝叶斯方法,为利用统计规律进行录井数据的自动处理提供了一种新的探索途径。关键词 统计模式识别;录井;油气评价;
2、贝叶斯方法 中图分类号 TP391?4 文献标识码 A?文章编号 16731409(2006)03006603?在综合录井油气评价方面,目前主要还是采用传统的相面法和各种图版解释法。这些方法均存在着主观因素影响较大,适用范围窄,各种参数的信息没有得到充分利用等弊病。由于综合录井的各种参数本身蕴藏着大量的统计信息,笔者认为可将统计模式识别方法 1应用于综合录井油气评价中。为此探讨了统计模式识别方法在综合录井油气评价中的适用性,验证了录井参数的统计规律,建立了一套完整的基于统计模式识别的综合录井油气评价系统软件,并运用于现场以提高油气评价的符合率。1?统计模式识别方法和步骤1?1?录井参数选择和数
3、据降维映射方法为了选择有效的特征,需要进行特征参数的筛选。特征选择通常包括两方面的内容:一是对单个特征的选择,即对每个特征分别进行评价,去掉分类能力不强的特征,从中找出那些对识别作用最重要的特征;二是从大量的原有特征出发,从多侧面进行识别,构造少数有效的新特征,对参数进行降维映射。笔者针对钻井过程中综合录井参数用统计模式识别方法对油气性质进行评价与解释。主要考虑 15个基本特征,它们是 6个气测特征参数(C1,C2,C3,iC4,nC4,C5)和 9 个地质特征参数(岩屑颜色、岩性、荧光湿照颜色及含量、干照颜色及含量、喷照颜色及含量、系列对比);另外,在实际应用中,还选用 9个烃组分比值作为特
4、征参数,它们是 3 个 PIXLER 比值法用参数(C1/C2,C1/C3,C1/C4),3 个 3H 法用参数(WH=?C-C1/?C,BH=(C1+C2)/(C3+C4),CH=C4/C3)和 3 个三角形坐标比值法用参数(C2/?C,C3/?C,nC4/?C)。上述 3 种方法就是传统的图版解释法 2。这样就组合成 24 个特征参数。按文献 3 的总结,样本数应是特征数目的 5 10 倍(若特征众多,特征空间庞大;而样本数相对很小,或者说在特征空间中样本数目稀疏,则无法找出分类识别规律)。而对于不同区域、不同层位以及不同的钻井条件,气测参数的绝对值变化范围可能很大(相差几倍到十几倍),因
5、此一般不直接把它作为判别特征。但是气测参数比值关系并不受上述因素的影响,对气测参数进行变换后的比值更能够客观地反映油气的性质。为此,对原 24 个特征参数进行降维映射处理,设定参加判别的特征参数为 18 个:9个烃组分比值与 9 个地质参数。这些新的特征参数对于不同的油气层均反映了不同的必然规律。1?2?综合分布函数的选择通过对样本的分布研究,发现它们既不是那些典型的分布,同时又无法直接用某一函数表示。为此选用了窗函数法和近邻法 4来求其综合分布函数。?66?长江大学学报(自科版)?2006 年 9 月 第 3 卷 第3 期 理工卷Journal of Yangtze University(N
6、at Sci Edit)?Sep?2006,Vol?3 No?3Sci&Eng V?因为样本数目较少,样本统计不能直接用于分类,统计结果不具有一般意义。对离散量(这里是指地质参数),可参照有关专家的意见进行补充得到一般性结果。如荧光颜色为亮黄色、系列对比为 8 15 级、岩性为砂岩、岩屑颜色为棕色就可定义为油层,等等。对连续量或具有连续意义的离散量,可通过用一小区域内的统计结果来估计,从而得到更一般的分布,这可以通过窗函数法来实现。常用的窗函数有方窗函数,一般称为方窗。除此之外,还有正态窗函数、指数窗函数等。也可以从近邻原则出发得到分布函数的估计,称这种分布函数的估计方法为相对近邻估计法。1?
7、3?贝叶斯准则统计模式识别的贝叶斯公式 5为:?P(?i/XK)=P(XK/?i)?P(?i)?Mi=1P(XK/?i)?P(?i)式中,假定要研究的问题有 K 个类别;X 为样本特征;各类别状态用?i来表示;P(?i)为先验概率;P(XK/?i)为类条件概率密度;P(?i/XK)为后验概率。若不考虑先验概率 P(?i),即比较后验概率P(?i/XK)之大小,按照基于最小错误率的贝叶斯决策,得出使错误率为最小的分类准则,若 P(?i/XK)=max P(?i/XK),则将 XK判定为?i。在前面对特征参数的分析中,根据确定的特征参数,确定特征维数为 18,类条件概率密度为:?P(XK/?i)=
8、?18j=1P(XK j/?i)由于这些样本的特征不完整,往往为 0。为避免这种情况,对上式两边取对数:?lgP(XK/?i)=?18j=1lgP(XKj/?i)式中,Xkj为第j 个特征。1?4?统计模式识别步骤统计模式识别步骤如下:1)样本输入。样本的输入可分为学习用样本和识别用样本,这两类样本都需预处理分别放置于对应的数据库中。2)样本统计。根据已知类别的原始参数进行样本统计,从而形成相应的数组和表格文件(相当于特征表示)。3)窗函数训练。根据建立的特征参数,按照指定的识别方法,采用?回代法?6或其他方法,如?刀切法?对已知类别的数据进行训练,最终得到最佳的参数。4)监控与测试。根据建立
9、的特征对象,按人工指定的识别方法进行识别并进行图形显示。5)识别。根据训练所得到的最佳函数参数按对应的识别方法得到相应的分布函数,然后对未知类型进行识别,至此整个识别过程结束。6)识别方法性能评价。通过识别正确率来评价。可以通过?刀切法?来估计,还可以同时训练分类器的有关参数。2?试验结果与分析使用某油田的实际录井数据,采用传统图版解释法和统计模式识别方法进行了对比试验(表1,2)。表 1?传统图版解释法试验结果试验数据ABCD解释方法试验结果ABCD33+2538+1432+1922+11PIXLER 比值法15+1017+314+610+2三角形坐标比值法16+1218+316+512+3
10、3H 法15+1020+418+614+5?表 1 中试验数据为不同油气类型及其样本数,用 A,B,C,D 表示,具体为:?67?第 3 卷 第 3 期杜红等:统计模式识别方法在录井油气评价中的应用?A:油气层(33)?同层+干层(25)?B:油+油水(38)?气+气水+油气水(14)?C:油气层(32)?同层(19)?D:油层(22)?气层(11)括号内为试验用的样本数目。试验结果表示第 1类正确识别的样本数+第 2 类正确识别的样本数。根据表 1 所列数据,可求出传统图版解释法对于 A,B,C,D 这 4 种不同的油气类型的识别符合率分别为:?A:(48%+48%)?B:(53%+29%)
11、?C:(56%+32%)?D:(64%+45%)所求的符合率为 3种方法中最佳的符合率。可以看出其符合率在 50%左右,说明其符合率是比较低的。使用同样的试验数据,采用模式识别中的?刀切法?进行窗函数训练,得到表 2 所示结果。表 2?统计模式识别方法试验结果试验数据ABCD识别方法试验结果ABCD33+2538+1432+1922+11基于线性窗函数的贝叶斯方法31+1833+629+1220+3基于独立近邻原则的贝叶斯方法26+1930+925+1216+7根据表 2所列数据,可求得使用统计模式识别方法的油气评价符合率为:?A:(94%+76%)?B:(87%+64%)?C:(91%+63
12、%)?D:(91%+64%)同传统的图版解释法相比,用统计模式识别方法所得的符合率要高得多。3?结?语经过上述分析和实际比较,统计模式识别方法显示了其稳定的识别能力,充分提取了录井数据中所蕴藏的统计信息,克服了传统方法在这些方面的不足。通过对比试验表明,基于统计模式识别综合录井油气评价系统大大提高了油气评价的符合率;同时由于具有自学习功能,因此该方法适应范围广,自动化处理程度高,对于提高油气评价的符合率不失为一种新的探讨方法。参考文献 1 杨学瑜?模式识别 M?第 2 版?北京:清华大学出版社,2001?2 张成,王振平,杨春华?泌阳凹陷油气层识别及评价技术 R?河南:南阳油田录井公司,2000?3(美)Andrew R?Webb?统计模式识别 M?第 2版?王萍 译?北京:电子工业出版社,2004?4 杨光正?模式识别 M?北京:中国科学技术大学出版社,2001?5 边肇祺?模式识别 M?北京:清华大学出版社,1998?6(美)Richard O?Duda?模式分类 M?李宏东,姚天翔 等译?北京:机械工业出版社,2003?编辑?易国华?68?长江大学学报(自科版)2006年 9 月