《知识图谱在证券行业合规风控方向的应用研究——在反洗钱监测分析和集团派系识别中的探索与实践.docx》由会员分享,可在线阅读,更多相关《知识图谱在证券行业合规风控方向的应用研究——在反洗钱监测分析和集团派系识别中的探索与实践.docx(15页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、知识图谱在证券行业合规风控方向的应用研究在反洗钱监测分析和集团派系识别中的探索与实践合规经营是证券公司生存发展不可逾越的底线,风控能力是证券公司把握好风险和收益平衡、确保长期健康发展的有效抓手,合规风控对于金融机构的业务风险探查和风险揭示起到重要作用。近年来我国金融机构在现代化管理体制上面临较大的合规风控压力:一方面,合规成本日益高昂;另一方面,随着违法违规行为日益复杂,原有的基于人工经验的合规系统建设已不能完全满足发现业务风险的需求。因此,探索知识图谱、图算法等技术在合规风控领域的应用,为资本市场未来合规风险管理应用场景提供更多可能具有重要意义。一、合规风控方向的知识图谱技术(一)合规风控的
2、主要技术手段合规风控工作应用的主要技术手段包括人工智能、大数据、机器流程自动化、联邦学习、知识图谱等。1人工智能(AI)与传统规则互补,提升监测与报告效率,能够挖掘、发现新型洗钱模式,不断优化迭代现有模型和场景,并可保证警报优先级顺序。常用的AI模型技术包括聚类、异常监测、有监督模型、自然语言处理等。2大数据开展数据治理,除结构化数据外,也可运用非结构化数据,提升合规风控领域的数据质量,完善数据管控治理,发挥非结构化数据价值。3机器流程自动化即模拟人类与计算机的交互,代替人工处理复杂、烦琐以及大量的各项事务,从而大幅减少企业的人力成本,提升整体工作效率,甚至能够辅助发现工作流程中不必要的环节,
3、实现流程优化。4联邦学习技术在保护客户隐私与数据安全的前提下,联邦学习技术可实现多机构联合建模,获得更完整的监测模型。5知识图谱知识图谱从关联和概率的角度出发,在描述数据背后 “真理”的基础上,模拟人的思维,智能展示分析和推理能力,这是最接近人类心中的“人工智能”。(二)知识图谱在合规风控上的应用价值及场景目前运用知识图谱的行业主要集中在社交网络、金融、保险、零售、广告、物流、通信、IT等领域。在合规风控领域中,知识图谱可应用于反欺诈、反洗钱、互联网授信、保险欺诈、银行欺诈等场景中,主要能实现可视化展示、关联分析、丰富特征指标、洗钱风险事中监测等功能。一是使用图数据库存储客户信息,并借助知识图
4、谱工具实现可视化展示,定义点、边及属性,以拖拉拽可视化形式,快速展示客户信息全貌,为监测分析人员提供灵活、直观、高效的分析工具。二是金融机构积累的碎片化数据之间存在着大量基于关系的知识,运用知识图谱,可实现实体之间的关系管理和探查,并且支持挖掘、分析未知关系,为监测人员提供知识的快速查询和挖掘、分析服务。三是知识图谱本质上是对内外部各渠道客户身份、交易信息的整合和加工,可以多层次、跨地区俯瞰、挖掘、刻画客户隐蔽性、复杂性关联关系及交易特征,用于模型构建,丰富特征指标来源,提高特征及模型质量。四是基于图分析和半监督的机器学习模型,支持主动识别客户行为和关联的异常,对具有标签的实体进行关联扩散,可
5、以支持在开户、交易等环节进行事中干预、提前预警,将洗钱风险管控从事后向事中前置。二、知识图谱在合规风控上的实践(一)基于知识图谱的反洗钱监测分析本文模拟人工分析思路,搭建可视化监测分析辅助工具,使用知识图谱建立客户直接的各类关系网络图谱,挖掘客户关联关系、刻画客户全貌。构建反洗钱知识图谱的整体思路是:首先,建立客户基础信息、委托交易关系、转账关系、社会关系等各类关系图谱;其次,基于图谱建立一些可疑客户的社区发现规则,发现一些社区团伙。设计知识图谱,即设计知识图谱的三要素实体、关系和属性。然后根据数据特性,分析数据和业务规律,按照构建好的知识图谱的节点、边及属性,多维度提取特征,用于后续构建图谱
6、(见图1)。基于上述目标,设计了13类实体、16类关系,主要维度、关系及属性如下:客户维度基本信息:基于一户通号、客户号、证券账户、资金账户、托管账户的基本信息。客户维度和时间维度的行为信息:资金转入转出、证券委托交易及撤单、更改资料等。身份证号维度:籍贯、出生日期、年龄等信息。操作工具维度:手机号、IP、Mac等特征。基于实体构建关联关系,包括一户通号客户号,客户号身份证号,客户号手机号等;客户号客户号,手机号手机号等。反洗钱知识图谱如图2所示。进一步基于星环Sophon KG平台(即知识图谱应用平台)可视化地构建图谱和分析图谱,以拖拉拽可视化形式,定义点、边及属性,完成知识图谱构建,快速展
7、示客户信息全貌以及一些反洗钱犯罪团伙/关联账户或者链条的信息,辅助人工分析。利用机器学习技术绘制知识图谱,丰富了信息来源和特征维度,为分析人员提供了灵活、直观、高效的分析工具,促进发现复杂、隐蔽、跨地区的异常行为和可疑线索,并在安全前提下打破分散作业模式下的数据壁垒,有效提高了人工分析核查效率及效果。(二)反洗钱监测分析图谱结果验证1客户画像查询展示对于目标可疑客户A,由一户通出发,可查找并展示各种属性、关联实体客户号,该客户有4个客户号,涉及多个委托手机号、多个Mac地址(见图3)。2关联账户查探由一户通客户A的客户号A1A4出发,通过共用操作设备、集中交易标的等,发现多个客户之间的关联关系
8、(见图4)。客户A与客户B预留了同一个联系电话,客户C与客户A4共用同一个手机号进行委托,客户D与客户A4共用另一个手机号进行委托。因此,由同一客户A的4个客户号,通过操作设备,可以发掘关联客户B、客户C和客户D。3深入挖掘洗钱团伙使用cypher语句高级查询,挖掘上一步无法直接发现的可疑关联客户。由客户C和客户D2,可深入挖掘出关联的客户E和客户F,他们频繁地集中操作个别股票,且存在大量撤单行为。因此怀疑此团伙存在洗钱风险,可进一步核查确认。(三)基于知识图谱的集团派系识别随着证券公司创新业务不断涌现,母子公司业务交叉、多重授信,加之金融市场信用违约事件日益增多,主体之间因为多维的关联关系,
9、如股权、担保、抵质押、一致行动人、夫妻等,使得风险可能在主体间存在复杂的隐形关联。本文使用了知识图谱相关技术手段构建公司同一客户认定及管理的完整解决方案,识别包含管理层、实控人、股权等关系的同一客户认证以及关联客户识别等关键问题,以此找出主体间可能存在的复杂的隐形关联,并最终应用于以信用风险管理为核心的全面风险管理中,同时可为其他风险管理场景提供支持。1图谱实体关系设计从业务角度出发设计同一客户集团派系持股关系知识图谱,图谱包含三个要素,即实体、关系和属性。实体中既包括企业ID、企业名称、统一社会信用代码、注册资本等基本信息实体,也包括其股东ID、股东名称、股东类型、股东类别等这类相关性实体。
10、关系边中则包括股东持股份额、股东持股比例、股东职务等基本关系,以便于查看相关客户企业基本信息。2持股关系图谱构建基于加工好的点、边的特征宽表,在机器学习平台上以拖拉拽可视化形式定义点、边及属性,构建并固化集团派系持股关系知识蓝图(见图5)。三、合规风控的应用研究成果(一)反洗钱监测分析的研究成果1整合内外部数据,夯实监测分析基础全面整合公司内部业务、合规、风控等系统与客户身份、资金来源、交易特征、行为特点、交易目的相关数据,结合负面舆情、证券信息、实体关系等第三方数据,丰富客户信息数据来源。2深入刻画客户图像,可视化辅助监测分析使用图数据库存储客户信息,并借助知识图谱工具实现可视化展示,定义点
11、、边及属性,以拖拉拽可视化形式,快速展示客户信息全貌,为监测分析人员提供灵活、直观、高效的分析工具。3探查隐蔽复杂关系,促进关联账户挖掘在全公司范围内,跨地区、跨业务,基于客户留存身份信息、委托地址、交易信息等,探查客户、账户之间复杂、隐蔽的关联关系,促进内幕交易、操纵市场、非法利益输送、经营场外配资等犯罪行为的关联账户挖掘,充分发挥金融情报价值。4模拟人工分析思路,丰富监测分析特征和规则梳理可疑交易监测分析所需的数据和信息,拓展外部数据,完善知识图谱的点、边、属性(关系)需求,并借助大数据平台海量数据整合、运算效力,设计针对性强、复杂度高的监测分析特征和规则,补充完善现有反洗钱监测预警体系。(二)集团派系识别的研究成果1实现不同数据源的同一客户认定通过整合不同数据源以及对数据的清洗和预加工,完成不同数据模块的同一客户认定,实现通过同一客户的ID信息查找即可发现其关联的所有股权关系。2实现全部客户企业的集团派系划分通过运行集团派系识别算法,可根据业务逻辑的需要将所有客户划分到其所属的集团和派系,并根据底层数据每日更新的频率,保证业务人员核查名单数据的实时性和准确性。3实现核查企业数据的易操作性针对包含企业数量较少的集团或者派系,业务人员直接在画布上核查分析,而对于不易在画布上查看的大集团和派系,通过一键导出功能快速导出集团或派系名单,以便业务人员核对分析。15