FDNet:用于煤爆预测的知识与数据融合驱动深度神经网络.docx

上传人:太** 文档编号:46201382 上传时间:2022-09-25 格式:DOCX 页数:13 大小:801.87KB
返回 下载 相关 举报
FDNet:用于煤爆预测的知识与数据融合驱动深度神经网络.docx_第1页
第1页 / 共13页
FDNet:用于煤爆预测的知识与数据融合驱动深度神经网络.docx_第2页
第2页 / 共13页
点击查看更多>>
资源描述

《FDNet:用于煤爆预测的知识与数据融合驱动深度神经网络.docx》由会员分享,可在线阅读,更多相关《FDNet:用于煤爆预测的知识与数据融合驱动深度神经网络.docx(13页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、FDNet:用于煤爆预测的知识与数据融合驱动深度神经网络抽象煤爆预测是煤矿平安生产的重要研究热点。本文介绍了 FDNet,这是一个用于煤爆预测的知识和数据融合驱动的深度神经网络。 FDNet的主要思想是基于现有的矿井地震物理模型提取显性特征,并利用深度学习自动提取矿井微震数据的隐式特征。FDNet 的主要创新包括基于子集搜索策略的专家知识指标选择方法、基于深度卷积神经网络的矿井微震数据提取方法、基于注意力机 制的矿井微震数据特征深度融合法。我们在高家堡煤矿进行了一系列工程实验,以评估FDNet的性能。结果说明,与最先进的 数据驱动机器和知识驱动方法相比,FDNet的预测精度分别提高了 5%和1

2、6%。关键字:煤爆;煤矿平安;融合驱动;深度神经网络1.引言煤爆是煤矿开采中常见的地质灾害。大多数矿业国家,如加拿大、美国、德国和澳大利亚,都记录了煤爆1, 2, 3o灾 难的原因是,当煤和岩体的应力积累超过其强度极限时,弹性能量瞬间释放出来,导致煤和岩体的瞬间破坏4, 5, 6, 7o伴随 着大量煤和岩体的大量涌出,煤爆在煤矿造成人员伤亡和设备损坏网。从2018年到2021年,中国煤矿发生了多起煤爆事故, 造成约20人死亡。因此,煤爆监测预警是当前研究热点。煤爆的预测和预警对于利用电磁辐射法、微重力法、红外热成像法和微震监测等方法,对施工阶段煤爆的一些前兆信号进 行监测至关重要;然后,可以对

3、煤爆的发生进行早期预警。微震监测是使用最广泛的早期预警方法之一9, 10, 11o通常,在煤 爆发作之前会发生几个微震事件,这些事件记录了有关煤断裂和应力转移的前兆信息。微震监测可以实时确定这些微震事件的 时间、位置和强度,从而预测煤爆的发生12, 130利用微震数据进行煤爆预测的研究工作可分为知识驱动和数据驱动两大类。知识驱动的煤爆预测方法利用地球物理学建立多种指标(利用频率、能量、匕值、A (匕)值等)构建煤爆预测模型14, 15, 16, 17。然而,这些方法无法完全获得矿山微震数据的序列信息,导致识别精度较差。借鉴地震预测的成功经验18, 19, 20, 21,近年来,基于机器学习的数

4、据驱动煤 爆预测研究工作较多22, 23, 24o其中,深度学习在煤爆预测中具有良好的应用前景,因为它可以自动提取海量矿井微震数 据的隐式特征25, 26, 27o但是,这类工作只是从统计数据的角度出发,没有整合现有的专业知识,识别精度有待进一步提 高。此外,数据驱动的方法还存在可解释性差等问题。针对上述问题,木文提出了一种新型的知识和数据融合驱动的煤爆预测深度神经网络,称为FDNeto FDNet的主要功能 是利用微震数据来预测未来1-3天内是否会发生大能煤爆。主要思想是在现有矿井地震物理模型的基础上提取显性特征,利用 深度学习自动提取矿井微震数据的隐式特征,然后基于聚变特征构建煤爆预测方法

5、。构建上述模型主要面临以下关键挑战:(1)如何为不同的煤矿选择具体的专业知识指标;(2)如何从海量矿井地震资料 中提取隐式特征;(3)如何深度整合知识驱动和数据驱动提取的特征。针对第一个挑战,我们设计了一种基于子集搜索策略的专 家知识指标选择方法,以解决微震数据挖掘的多指标筛选问题。针对第二个挑战,我们建立了一种基于深度卷积神经网络的矿 井微震数据提取方法,实现了海量矿井微震数据的隐式特征提取。针对第三个挑战,提出一种基于注意力机制的矿区微震数据 特征深度融合方法,实现基于知识驱动和数据驱动的特征融合。本文的主要贡献总结如下。据我们所知,这是第一次研究用于煤爆预测的知识和数据融合驱动的深度神经

6、网络。该网络利用专业知识和数据隐臧 信息的融合功能。4.3.2.序列长度的影响为了评估不同前体模式序列长度对模型性能的影响,本实验使用不同的序列长度进行模型测试。实验设置如下:采样时间窗口我二22h、预测时间N=22h、和损失函数平衡系数Z。=.在上述参数保持不变的条件下,我们将前体模 式序列长度p设置为6, 10, 14, 28, 42, 56o我们在每个序列长度上设置两个大能量阈值,E=SxlC)4J和E=2x2OsJ,然后运行模型测试。模型测试结果如图6所示。实验说明,当能量阈值较大时E=5xL94J、较短的前体模式序列有利于改善 一个CC和TPR.的模型。案例到达最高一个CC,到达81

7、.77%;其TPR到达88.54%,并且FDR仅为22.02%。当大能量阈值E二2X2O5J、案例a二28到达最高一个CC,到达78.16%,以及FDR到达23.35%。综上所述,在两个大能量阈值的条件下E=5x2O4J和E=1xL9sJ,最优序列长度p分别为6和28。1.0,u. riw q. |) JrJKl (I 5/Q; u,|.0l&, 工61014 2sg 56Se9Hcwe I 1.2 Balance Factor6 4 2 r 19 1.00.80.20. 18J.0 0.18.1.2 0. IK. 1.4 0.电 1.5 1.0.1.0 1.0. 1.2Balance Fac

8、torL0t L t 1.0,1,5O.o.uo-5- pad图8.不同平衡因素的测试结果。4.4.跨工作面性能测试为了评估预测模型在工作面上的性能,此实验使用来自高家堡204工作面的数据来训练模型,然后使用该模型在正在开 采的301工作面上对其进行测试。实验设置如下:时间窗口大小仁22h,前体模式序列长度?二28、预测时间N=72h, 平衡因子(1.0, 1.4)。在上述参数不变的情况下,E=SxW4J和E二工XL95J分别用作大能量阈值。实验结果示于表 4中。实验说明,在交叉工作面预测的情况下,模型的准确率仍高于75%。可以看出,同一矿区的不同工作面具有相似的特征。本文的预测模型在交叉工作

9、面的情况下仍具有较好的性能。表4.交叉工作面性能测试结果。与单驱动模型的比拟为了验证本文提出的融合驱动预测模块的有效性,选取204个工作面的数据进行模型训练。实验参数设置如下:时间窗 口大小仁22h,前体模式序列长度?=28、预测时间N二72h,平衡因子(1.0, 1.4)。在大能量阈值条件下E=Sxld?4J 和我们分别训练了“数据驱动+知识驱动”、“数据驱动”和“知识驱动”三种模型。如表5所示,实验说明,融合驱动模型的准确率超过75%,且TPR在两个大能量阈值下超过81%。“知识驱动”模型的准确率在60%到65%之间。虽然数据驱动”模型的准确率也到达了 70%以上,但其TPR比“融合驱动”

10、模型低约7%。因此,“融合驱动”模型明显优于“知识驱动”模型,大能量事件的预测效果相对于“数据驱动”模型有所提升。可以看出,与单驱动模型相比,“融合驱动”模型在预测精度上有了显著 的提高。表5,单驱动模型和融合驱动模型的测试结果.5.结论本文介绍了 FDNet,这是一个用于煤爆预测的知识和数据融合驱动的深度神经网络。首先,我们设计了一种基于子集搜 索策略的专业知识指标选择方法,以解决挖掘微震数据的多指标筛选问题。然后,我们建立了一种基于深度卷积神经网络的矿 山微震数据提取方法,实现了海量矿山微震数据的隐式特征提取。最后,提出一种基于注意力机制的矿山微震数据特征深度融 合方法,实现基于知识驱动和

11、数据驱动方面的特征融合。此外,我们还进行了一系列工程实验,以评估FDNet的性能。我们评 估了不同因素的影响,并将模型与最先进的方法进行了比拟。结果说明,FDNet具有良好的预测精度和鲁棒性。但是,FDNet 并不适用于所有煤矿,因此我们将在未来的工作中对模型的泛化能力进行研究。我们建立了一种基于深度卷积神经网络的新型矿山微震数据提取方法,并提出了一种基于注意力机制的矿山微震数据 特征深度融合方法。我们在高家堡煤矿进行了一系列工程实验,以评估FDNet的性能。结果说明,与最先进的数据驱动和知识驱动方法 相比,FDNet的预测准确率分别提高了 5%和16%o2.概述如图1所示,本文的研究主要包括

12、三个局部:矿山微震数据处理、特征提取和预测模块。202111071 in,2 3O 心2021110714 02 112021110720211108M34 06Raw Datal.sbelLncrx2斜/821/I I 口 Data ConversionPrccurxon pxllrrn sequence in A dujsMo lojyc Fnagy ActrtlodnM t.*rrKW.02如“-iT 1t1必2 55”丁32 .29 72,47r9 !32”“ 89“24必42e -1厂一I *(Feature EXECtionFeature EXECtionKnowledge Dri

13、venlliuivaiurEA|JIIVIIExpert Knowledge Selection FeaturesLabel DataData DrivenooooooO :oooooo: :OOOOOO;ImplicitFeaturesPrediction Mode-Prediction Mode-f Explicit、 I Features :mvTTnjFeature FusionA-ent-onFusion FeaturesClassificationNetworkOutput图1 ,知识和数据融合驱动的深度神经网络架构。矿山微震数据处理将微震传感器提供的原始数据转换为前体模式系列数据

14、,用于模型输入。微震系统保存的原始数据包括 微震事件的时间、微震事件的能量以及微震事件源的坐标。首先,对原始数据进行统计分析,计算日最大能量值和平均能量值, 生成以日为最小单位的时间序列数据。我们指定前体图案序列长度以生成多个前体图案序列及其标记。特征提取包括知识驱动的显式特征提取和数据驱动的隐式特征提取。显式特征是指由专家知识计算的相关指标,包括b 值、a值、A(b)值、地震缺失、微震活动规模AF、微震时间信息增、等效能级参数EEMI和微震活性S值。针对不同的煤矿,提出一种子集搜索方法,选择具体指标,获得最优的显示特性。隐式特征是指使用深度学习方法从海量数据中挖掘的隐藏 规律性信息。本文采用

15、卷积神经网络实现隐式特征提取。预测模型包括特征融合和分类网络。在特征融合局部,我们提出了一种基于注意力机制的显隐特征深度融合方法。在分类 网络局部,我们通过全连接网络拟合实现分类,从而构建了煤爆大型能源事件的预测模块。3.详细设计31数据处理数据库的原始数据包含微震时间、微震能量、源坐标等信息。如图2所示,需要对原始数据进行以下处理,以适合模型 的训练和预测。Raw DataIndexDateTimeEnergy02021110712:30:4523212021110714:02:111.42*?J. 82021110720:46:583.53xc292021II0K09:34:088.2 |

16、xc-102021110810:23:432.78mJ .r232021110818:33:206.12* JCollection of Time Series Data GIndexDateMax E.Mvun E.Frequency20211107L42xeJ7.65*e223202111082.78,J2.66xc534202111092J5*cJ2|xr19. ” Collection of图2.数据处理的工作流。首先,我们使用固定的时间窗统计信息构建时间序列数据集。假设在第,个时间窗口中计算的数据记录为Mi,可以表示 为:飞,二以 把小“乂把小。八(1) 哪里id是时间窗口编号,是时

17、间窗口中的最大能量,Cmc”八是时间窗口中的平均能量,f是时间窗口中微震事件的频 率。因此,当数据划分为n个时间窗口时,基于上述方法遍历时间窗口,可以得到时间序列数据集M = ( %0网2网2)网八-工).然后,基于上述处理的时间序列数据构建前体模式序列。假设,前体模式序列为Si,可以表示为:9-(何可回时巴而小2”.可邙”2(2) 其中p是前体模式序列的长度,/是采样步长。因此,在。个时间窗口的前提下和八斗,前体模式序列集可以基于上述方法生 成:s 二soaa.sD-i)(3) 其中。表示在预测时间范围为N小时的情况下,前体模式序列样本中前体模式序列的数量。对于模型训练,需要建立与前体模式序

18、列集相对应的标签集,可以表示为:工丈-工)哪里也是前体模式序列的标记Si,如果即将发生大能量事件,七二1;否那么台二。.其计算方法如下列图所示:f(x)=工 0NE(4) 哪里&是前体模式序列的最大能量值Si在接下来的/V个小时内。E是大能量事件的能量阈值,通常取为5xL94J或32特征提取知识驱动的显式功能显式特征是基于专业知识提取的特征,包括b值28、僮29、A(b)值30、地震无31、煤爆活动规模F32、微震时间信息端33、等效能级参数EEM 地震力S值等多个矿井地震指标作为明确的特征候选集。考虑到不同煤矿地质构造 等因素的影响,并非所有指标都适合煤爆预测。因此,为解决不同煤矿微震指标的

19、选择问题,设计了一种微震指标的反应选择 方法。该方法的主要思想是动态添加指标,然后利用矿井中其他开采工作面的数据,在添加不同指标后计算模型精度,并根据 精度判断指标集是否最优。具体步骤如下。假设微震指标的集合是一个一个2,,一个我们将每个指标视为候选指标的子集,并评估m个候选单一指标的子集。假设在第一轮中设置的最正确候选项为一个2;我们把它作为第一轮选择集。接下来,向此选定集添加指标将构成由两个指标组成的候选子集。假设一个2,一个5)在米-2候选子集,并将其用作第二轮选择集。直到匕舍入,最优候选子集不如上一轮;然后,第,轮指标集用作最终的特征选择结果。本研究以特征子集优缺 点的评价标准是特征子

20、集在不同数据集和不同采样方法上的平均模型精度。基于上述方法,可以筛选出不同煤矿的具体指标作 为显示特征。反应型微震指标选择机制解决了微震指标选择问题,提高了模型预测精度。3.2.1. 数据驱动的隐式特征如图3所示,为了挖掘海量微震数据中的隐藏规律,我们提出了一种基于深度学习的隐式特征提取方法,该方法在深度学 习中使用卷积神经网络来实现隐式特征提取。卷积神经网络是专门设计用于处理具有网格状结构的数据的神经网络。卷积神经 网络具有学习表示的能力35, 36, 37, 38o它的人工神经元可以响应覆盖区域中周围单元的一局部。它们由一个或多个卷积 层、顶部的全连接层以及关联权重和池化层组成。这种结构使

21、卷积神经网络能够利用输入数据的二维结构。隐藏层中的卷积核 参数共享和层间连接的稀疏性使卷积神经网络能够以少量的计算实现隐式特征提取。因此,本文利用深度卷积神经网络提取海 量矿井地震数据中的隐式特征。采用的卷积神经网络为3层卷积,包括88个卷积核,输出1000维隐式特征向量,为本文提取 的隐式特征。l*rccurMir)Sequence64 CtuiinehKOlMiinctUNmnl Imphul 1 Mure图3.基于卷积神经网络的数据驱动特征提取网络.33预测模块基于训练数据集,生成预测模块建立目标函数,并利用反向传播算法更新网络权重,使目标函数的损失最小化,从而生成 预测模块。训练后的模

22、型可用于大能量事件预测,可以预测未来是否会发生大能量事件。预测模块主要包括两个模块:特征融 合和分类网络。第节介绍了特征融合,第节介绍了分类网络,第节介绍了模型训练。3.3.1. 功能融合在预测模块中,显式特征和隐式特征需要深度融合。显式和隐式特征的复杂性和异质性使得简单的加权特征融合方法不合 适。因此,本文采用注意机制方法39实现特征融合,可以实现显式特征和隐式特征内各维度的加权。如图4所示,首先,显式特征Fc和隐式功能F我合并以获得初始特征向量Fs:Fs=%F 我(6)其中显式和隐式特征向量的维数(Fe Rd工F我 Rd我)是d工和dz分别。融合特征向量的维数Fs R(di+d2)是cl计

23、dz.在注意力机制40, 41中,显式特征和隐式特征的权重向量表示为ZeRdi,M我GRd2.计算方法如下:MeV 我二H(Fs- Me)二Hg M 我)哪里Me CR+42)x42和M我e R(di+d2)xd2是两个可学习的参数矩阵;H(x)是激活函数。+e-x.权重向量的每个维度Ve和Mi对应于每个特征尺寸的重量Fe和R.最后,最终融合特征向量Ff计算公式为:FfFeOVe.FiQVi(8)其中。表示哈达马德产品。融合要素将用作后续分类网络的输入。Implicit FeaturesIExplicil FeaturesLearnableParameter Matrix )concaonat

24、eMeLearnableParameter Matrix /MultiplicationMultiplicationctivation FunctioActivation Functio WeightedConcatenateWeighted Jusion Features图4.特征融合过程的工作流。3.3.2. 分类网络预测模块中的分类网络由全连接层和激活函数组成。在深度学习中,全连接层充当分类器,可以将学习到的分布式特征表 示映射到样本标签空间42, 43o此模型中的全连接层由2000个神经元组成。然后,使用激活函数进行归一化,以获得是否存在大能量事件的概率。如果大能量事件的概率大于没有大

25、能量事件的概率,那么输出为1;否那么,输出为0。3.3.3. 模型训练考虑到大能量事件的低概率,训练数据集样本是不平衡的,其中标记为小能量事件的数据远远超过具有大能量事件的数据。如果采用传统的深度学习模型训练方法,会导致模型在分类过程中偏向于学习样本较多的类。为了解决这个问题,木文借鉴了“重 新缩放的思想。在训练过程中,模型可以根据批次样本和整体样本的分布,在计算损失时动态调整各类的权重。在网络训练中, 使用加权交叉燧损失函数计算模型的损失值,并通过不断更新神经网络模型中的参数,:恪模型在训练数据集上的损失降至最低。此外,在煤爆的预测任务中,为了降低大能量引起的事件的假阴性率,本文增加了各种学

26、习权重,No和Zi,转到损失函数。通过调整大能量事件的学习权重,该模型可以更偏向于大能量样本的预测,从而降低大能量事件的假负率。本文中的加权交叉 焙损失L可以表示为:LU 二1 NZi=NU=-zOxWOxgiOx八 pio-Z工 XW 工xgi 工xl 八piowotw 工(9)哪里Li表示第j个前体模式序列的损失值。N是前体模式序列的数量。NO和Z1分别表示两个类的学习权重。WO和W2分别表示类0和1的样本分布权重。如果标签的i前体模式序列是一个小能量事件,那么9力二工,93二。;否那么gio二。,是观测到的样本/为0类的预测概率。p况是观测到的样本,为1类的预测概率。上述方法有效改善了

27、数据类别不平衡问题,有效加快了模型收敛速度,提高了模型预测精度。4.工程实验为了验证聚变驱动模型的有效性,本文利用高家堡煤矿多个工作面的微震数据对大量实验进行了描述。首先,利用2019 年5月至2020年5月对高家堡煤矿204工作面的13, 058个地震数据,评估了模型的整体性能和不同参数的影响,并建立了 单驱动模型的比照实验。此外,利用高家堡煤矿204工作面的地震数据对预测模块进行训练,并利用该模型预测301工作面上 的大型能源事件,该工作面正在开采煤炭。实验结果说明,本文提出的预测模块在交叉工作面情况下仍然有效。评价指标在该实验中,混淆矩阵用于记录模型预测结果。如果实际情况为真且预测为真,

28、那么记录为TP (真阳性)。如果实际情况 为真,预测为假,那么记录为FN (假阴性)。如果实际情况是错误的,预测是错误的,那么我们记录TN (真阴性)。如果实 际情况为假且预测为真,那么记录为FP (误报)。在混淆矩阵的计算过程中,我们首先在前一段中定义真假。其中,“真”可以 表示为发生大能量事件煤爆假”意味着没有发生大能量事件。这里定义了大能量事件的混淆矩阵。如表1所示,在模型评估中,本文采用了三个评估指标:准确率(一个CC),真实病例率(TPR)和错误发现率(FDR). 准确率是准确预测的事件数与事件总数的比率,反映了模型的整体性能。真实事例率是预测为真的事件数与实际为真事件数的 比率。该

29、实验表示在真实大能量事件样本中预测为大能量事件的前体模式序列的比例。误发现率是预测为真的实际为假的事件 数与预测为真的事件总数的比率,反映了模型的误报率。以上指标的计算公式如下:一个 CCTPRFDR=TP+TNTP+FP+TN+FN=TPTP+FN=FPFP+TP表1 .混淆矩阵。整体性能为了评估模型的整体性能,本实验的设计思路如下:使用工作面204的1-100天的数据训练初始模型,然后预测是否为 大能量事件(能量大于IxlOsJ)将在第101天至第103天发生。仿真时间缩短1天,模型更新。我们使用第1-101天的数据重新训练模型,并预测第102-104天是否会发生大能量事件。模拟时间再过一

30、天,模型再次更新。我们使用1-102天 的数据重新训练模型。然后,我们预测大能量事件是否会在第103天到第105天发生,依此类推。然后,总共测试了 250个模 拟预测。预测结果如图5所示;深绿色表示模型预测正确,浅绿色表示模型预测不正确。我们可以发现,随着训练数据集的不断 增加,模型的预测精度越来越高。表2显示了该模型的整体性能。准确率到达76.68%。真实病例率为73.13%,假阳性率仅为 19.01%o综上所述,融合预测模块具有良好的性能。WrongCorrect图5.整体性能。表2,整体性能测试结果。4.3. 不同参数的影响本小节测试不同参数(包括预测时间、序列长度、大能量事件阈值、数据

31、采样时间窗口大小和平衡因子)对模型性能的影 响。训练集和测试集使用机器学习中常用的省略方法进行划分,其中训练集和测试集的比率为7: 3o预测时间的影响为了评估模型在不同预测时间场景下的性能,实验设计如下。采样时间窗口我二12h、前体图案序列长度?二28和损 失函数平衡因子2,Z工二1.5.当上述参数保持不变时,我们设置预测时间N=24h,N=48h,N=72分别为h。在每 个预测时间设置两个大能量阈值,E=Sxlt54J和然后我们运行模型测试。表3显示了不同预测时间的实验 结果。结果说明,该模型能够有效预测未来1-3天内是否会发生大能量事件。在两个大能量阈值的情况下E=5xL94J和 E=lxWsJ最优模型性能N=72h,及其TPR可以到达81.15%。表3.预测时间的影响。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > 解决方案

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁