基于知识图谱推理的关系推演.docx

上传人:安*** 文档编号:73268280 上传时间:2023-02-17 格式:DOCX 页数:11 大小:20.07KB
返回 下载 相关 举报
基于知识图谱推理的关系推演.docx_第1页
第1页 / 共11页
基于知识图谱推理的关系推演.docx_第2页
第2页 / 共11页
点击查看更多>>
资源描述

《基于知识图谱推理的关系推演.docx》由会员分享,可在线阅读,更多相关《基于知识图谱推理的关系推演.docx(11页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、基于知识图谱推理的关系推演?。本文主要讲一下基于知识图谱推理的关系推演或叫做关系预测主要包括如下几个方面1、知识图谱推理的主要作用2、知识图谱推理的根本原理3、知识图谱推理的主要方法4、TransE算法理解1、知识图谱推理的主要作用针对知识图谱分析系统需要考虑哪些详细场景能用到推理算法根据目前解析大致可以分为如下的几种情况大量数据表到知识图谱转化的时候有局部数据是没有直接关联的需要通过推理算法来进展类别标注/关系连接补全加载业务模型时可以使用一些业务规那么或者逻辑规那么进展推理这些业务规那么可以是常用人机交互流程的固化,可以以是用户编辑的业务规那么使用分布式表示学习方法时可以利用表示学习后向量

2、做一些更高层次的应用比方计算相似度来做搜索、推荐或者输入其它机器学习算法中去完成相关的分类、聚类、推荐等2、知识图谱推理的根本原理知识图谱推理根据是否与业务相关主要可以分为基于规那么的推理以及基于算法的推理。1基于规那么的推理主要是通过业务本体框架中的相关约束来做相关的推理比方类别推理、属性推理等。想知道实体类别而没有直接给出-类别推理由底层类向高层类的推理是底层类那么必是高层类通过关系的定义域以及值域来推理关系的定义域以及值域是固定的实例具有这种关系那么实例就是定义域或者值域规定的类别2基于算法的推理基于算法的推理可以分为很多种基于途径的建模、分布式表示学习、基于神经网络、混合推理等但推理算

3、法获得的结果具有不确定性不一定等获得完全正确的关系只是一种预测可能性。比方通过观察到知识图谱中包含这样的一条途径“梅琳达盖茨-配偶-比尔盖茨-主席-微软-总部-西雅图推测出梅林达可能居住在西雅图。基于算法推理的根本原理一般情况下都是这样存在一定数量的三元组关系数据作为训练集以及测试集训练集以及测试集的头/尾实体、关系都来自于固定的实体集合以及关系集合也有基于开放域的通过训练集训练一个评分函数的参数再通过该函数给测试三元组关系做一个评估打分然后获得一个评分排名。这里面一般涉及到如下几个方面一个评分函数构造一个评分函数来对三元组成立的可能性进展打分这个打分函数是通过一定的计算操作来获得实体或者关系

4、之间的关联度。评分函数一般是计算实体e1与关系ro实体e2的相似度实体e1o关系r与实体e2的相似度关系r与实体e1o实体e2的相似度其中o是一种计算操作比方加法/乘法/非线性法等三种操作线性加法、乘法非线性神经网络自定义的类神经网络双层组合第一层建立表示向量的映射网络-编码第二层对表示后的向量进展组合评分函数-解码当然以上只是我根据大局部算法给出的一个大致的方法趋势并不是所有的算法都是这样详细算法需要详细讨论。一般来讲理解了TransE的原理以及源码其它算法的原理及源码就很好理解了。3、知识图谱推理的主要方法知识图谱相关的推理算法目前主要分为单步推理直接关系没有考虑途径特征以及多步推理间接关

5、系考虑途径特征在单步推理以及多步推理中主要包括4个研究方向基于传统的规那么推理、基于分布式表示推理、基于神经网络的推理、基于上述方法的混合推理。在每个研究方向又延伸了很多小的方向以及方法已存在的算法以及论文比拟多详细可以参考如下的分类图常见的一些算法间隔模型SE单层神经网络SLM能量模型SME双线性模型LMF张量神经网络NTN/ProjE矩阵分解模型RESCAL乘法方法SimplE、DistMULT(不区分头尾实体)、HOLE(区分头尾实体)、ComplEx(虚实向量)、Analogy(类比推理)TransE同一语义空间表示向量加法TransH让一个实体在不同关系下有不同的表示TransR认为

6、不同的关系拥有不同的语义空间实体向关系空间投射CTransR细分关系TransD为头尾实体构建不同的投影矩阵矩阵与实体关系都相关TranSparse为头尾实体构建不同的投影矩阵不同的矩阵稀疏度TransA损失函数中间隔度量改用马氏间隔并为每一维的学习设置不同权重TransG用高斯混合模型来描绘头尾实体一种关系对应多种语义每种语义用高斯分布表示KG2E头尾实体的向量差用高斯分布表示关系也用高斯分布表示评估两个分布之间的相似度ConvE图构造的多层卷积网络SimplE: (1)每个实体表示成两个向量头实体向量以及尾实体向量每个向量是独立的 (2)每个关系表示成两个关系顺关系以及逆关系向量DKRL

7、(1)构造化信息的表示原有的算法 (2)描绘性信息的表示用CBOW或深度学习网络对描绘信息进展建模 (3)能量函数EsEd(EddEsdEds)OpenKGC: (1)只用文本信息特征来学习实体以及关系的表示 (2)能为没有见过的实体学习表示向量但该构成该实体的单词必须是固定的PTransE: (1)可靠性途径的选择 (2)途径的表示学习语义表示-组合表示R-GCN/R-GCN (1)GCN提供了一个为图节点表示学习的框架 (2)R-GCN提供了一个三元组自编码解码的评分方法每种类别下的重要算法张量神经网络SLM、NTN、ProjE图卷积网络R-GCN/R-GCN、ConvE分布式规那么的混合

8、NaualLp、DKRL、RTJ、ComplexER、ComplexENNE基于途径的建模PTransE多源信息交融的建模:DKRL、KGC、NLFeat、TEKE_H、SSP几个重要趋势交融其它多源信息交融三元组实体的描绘信息交融三元组实体的属性信息交融网络文本信息把单词作为研究基准/把实体作为研究基准交融其它知识库信息参加途径信息参加业务规那么信息编码解码的原理、多层卷积模型混合使用4、TransE算法理解TransE模型的目的是学习出实体(entity)以及关系(relation)的低维向量表示。对于一个三元组(h,l,t)其中h以及t是实体h称为头实体t是尾实体l是它们的关系也就是属性

9、TransE祈望它们的嵌入表示(h,l,t)有如下关系thl也就是讲t要以及hl尽可能接近反之假如这三者不构成三元组那么要尽可能远离。用图直观表示如下为此TransE定义了三元组的“能量e(h,l,t)d(hl,t)这里的“能量论文中讲的theenergyofatriplet可以看作是损失函数d是一个间隔度量方法(dissimilaritymeasure)在这里就是向量之间的间隔即公式d(hl,t)hltL1/L2公式1中的L1/L2指的是L1或者L2间隔或叫L1或者L2范数。那么只要最小化公式1这个损失函数就行但为了增强区分度TransE构造了一些反例三元组祈望反例的间隔要尽可能的大这样最终

10、的优化目的损失函数就是公式公式2中的(h,l,t)是构造的反例三元组构造方法是将正例三元组的头实体或者尾实体交换成一个随机的实体且二者不能同时被交换即公式S(h,l,t)(h,l,t)hE(h,l,t)tE为了防止过拟合需要参加正那么项然后用随机梯度下降算法(stochasticgradientdescent)来最小化损失函数。帮助理解1需要找到一个向量来表示对应的实体、关系2找到一个什么样的向量当表示后的向量能构成thl这样一个等式关系就讲明这三个向量可以表示对应的对象。3怎样找到这样一个向量在向量维度确定的情况下通过构造一个损失函数来训练生成的向量知足thl关系使损失函数值最小否那么调整向

11、量。4详细怎样调整向量SGD获得第i个维度上的t-h-r理论上应该接近于零假如不等于零那么通过学习率来修改t/h/r在该维度上的值等整个维度都学习一遍那么t/h/r分别对应的向量完成了一次整体的学习。5怎样用来预测链接预测固定头/尾实体以及关系对计算的尾/头实体与真实的尾/头实体进展比拟遍历所有的实体代入间隔评分函数利用top-k准那么对于给定的k值预测算法会给出基于每个实体计算某种评分的排序来输出前k个答案两种评估的方法MeanRank:排名的平均值越小越好HitK:排名在前K位所占的比例越大越好6训练/测试经过训练经过初始化K维的实体向量以及关系向量对于每一个训练的三元组从初始化的向量中获得对应的表示向量通过计算loss函数来不断调整实体向量以及关系向量在每一个维度上根据学习率来修改测试经过假如是预测关系对于输入的每一个测试三元组用所有的关系向量依次去替代原关系向量分别计算L1或者L2间隔作为评估分数根据分数计算原关系的排名。7算法能完成的三个任务链接预测对头/尾实体缺失的三元组进展实体预测对于每一个测试的三元组用KG中的所有实体来代替首/尾实体并对实体进展降序排序三元组分类判断一个给定的三元组是否正确是个二分类问题。设定一个阈值通过该三元组的分数与阈值进展比拟确定三元组的正负关系抽取都抽取的三元组进展分类判断抽取的关系是否正确欢送关注微信公号数联将来zycnb1

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 技术资料 > 工程图纸

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁