《基于案例推理的保险欺诈案例分析系统设计.pdf》由会员分享,可在线阅读,更多相关《基于案例推理的保险欺诈案例分析系统设计.pdf(4页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第 2 9卷 第 5 期 2 0 0 8年 1 0月 闽江学院学报 J OURN AL OF MI N J I ANG UNI VE RS I T Y V0 1 2 9 No 5 0c t 2 o 0 8 基于案例推理的保险欺诈案例分析系统设计 孙锋(闽江学院数学系,福建 福州 3 5 0 1 0 8)摘要:案例推理(C B R)是人工智能领域中一种基于知识的问题求解和学习方法 文中以保险欺诈案例分析为背景,提 出基于案例推理和应用X ML来表示和搜索案例,应用数据仓库构建保险欺诈案例分析系统,并介绍了该系统案 例推理流程、相似性度量函数、案例相似匹配方法、案例维护等关键技术 关键 词:案例推
2、理;案例 匹配;保 险欺诈 中图分类号:T P 1 8 文献标识码:A 文章编号:1 0 0 9 7 8 2 1(2 0 0 8)0 5 0 0 3 1 0 4 De s i g n o f CBR i n s u r a nc e f r a ud c a s e a na l y s i s s y s t e m S UN Fe ng (D e p a r t m e n t o fMa t h e ma t i c s,Mi n j i a n g U n i v e r s i t y,F u z h o u,F u j i a n 3 5 0 1 0 8,C h i n a)A b
3、 s t r a c t:C a s e b a s e d r e a s o n i n g(C B R)i s a k n o w l e d g e b a s e d s o l u t i o n a n d l e a r n i n g me t h o d o f a r t i fi c i a l i n t e l l i g e n c e Ta k i n g the i ns u r a n c e fra u d a s a ba c k g r o u n d,A CBR i ns ur a n c e fra u d c a s e a n a l y s
4、i s s y s t e m S O-l u t i o n i s p r o v e d b a s e o n d a t a wa r e h o u s e wh i c h u s e CBR a n d XML t o e x p r e s s a n d s e a r c h c a s e Fo ur c r i t i c a l t e c h n i q u e s i n the s y s t e m(C B R p r o c e d u r e,s i m i l a ri t y me a s u r e m e n t f u n c t i o n,
5、c a s e s i mi l a r i t y m a t c h m e th o d a n d c a s e m a i n t e n a n c e)w e r e i n t r o d u s e d i n d e t a i l Ke y w o r d s:C B R(c a s e-b a s e d r e a s o n i n g);c a s e s i mi l a r i t y m a t c h;i n s u r a n c e fr a u d 0 引言 案例推理(c a s e b a s e d r e a s o n i n g,C B
6、R)作为人工智能由表层的机器模仿 向深层的机器思维发展过程中的 一种形式,已得到越来越多研究者的重视,其应用也愈加广泛 目前 国内已对其开展 多方面的应用研究 案例推理克服了规则推理的知识获取瓶颈和大规模信息处理的脆弱性,提高了推理 的速度,更接近于专家解 决问题 的思维 案例推理的思想最早由 R o g e r C S c h a n k在 1 9 8 2年提出 2 J 1 9 8 3年,J a n e t L K o l o d n e r 开发 了 第一个 C B R系统 引 保险欺诈是各国保险发展中一道共同的难题,其对保 险业的危害极为严重,从保险业诞生之 日起,欺诈 事件就如影随形
7、据有关统计数据显示,国际上某些险种 因被欺诈而导致 的赔款支出最高可达保险费收入 的 5 0 ,平均保险业务 的欺诈损失在 1 0 3 0 随着我 国国民经济 的快速发展,我 国保 险业也迅速崛起,但与西方经济发达国家相比,仍属发展时期 然而,发生在西方保险业 中的各种保险诈骗案,近年来却在我 国各地频频发生,且愈演愈烈,已成为侵蚀我国保险业肌体 的毒瘤 有资料显示,我国在 2 0世纪 8 0年代末 期,诈骗犯罪 中涉及保险欺诈 的仅 占 2 左右;到 1 9 9 4年底,这类案件上升到 6 左 右;到 2 0 0 0年则升至 9 1,到了2 0 0 5 年,更是上升近至 1 0 全国每年有上
8、百亿元的赔偿金流进骗子腰包 J 然而,国内对保险欺诈的研究仅限于定性描述,基本集中在保险欺诈的特征表现、成因和防范对策3 个方 收稿 日期:2 0 0 8 0 31 7 作者简介:孙锋(1 9 7 5一),男,福建福州人,闽江学院数学系讲师,高级工程师 3 2 闽江学院学报 第 2 9卷 面 运用智能方法进行复杂的保 险欺诈风险控制的研究还比 较缺乏 运用基于案例推理技术,结合 X ML技术和数据仓库 技术,通过对欺诈案例进行认真分析,从中提取有用的欺诈标识 字段建立保险欺诈案例数据库,建立保险欺诈案例分析系统,对 提高保险业防欺诈水平有较好的现实意义 1 案例推理 案例推理(C a s e
9、B a s e d R e a s o n i n g,简称 C B R)是伴随着认知 心理学的研究而发展起来的一种新的推理方式,属于类 比推理 方法,其基本思想是基于人们在问题求解中总是强烈依赖于以 往处理类似问题的事例、经验和获取的知识,再针对新旧情况的 不同做出相应的调整,从而得出新问题 的解并形成新的案例 作为一种新的推理求解模式,C B R不仅使知识获取更加简便、快 捷,而且极大地改善了推理的速度和质量 基于案例推理的结构示意图如图 1 所示 新 问题 图 1 基于案例推理的结构 Fi g 1 S t r u c t u r e b a s e d o n CBR 基于案例推理是人工
10、智能领域较为成熟的技术 现实世界 中,许多有价值的知识难于用规则来表示,而用规则表示的知识系统又难于维护 基于案例推理是对知识获取 和表示方式的拓展,也符合客观世界的规整性和重现性,即相似条件下发生的动作会产生相似结果,过去的经历 很可能预示未来 基于规则的知识推理是链式推理过程,只涵盖了人类智能活动的部分模式 认知科学对人类 推理和学习机制的研究发现,人类更习惯于有意识或无意识地回忆借助经验来决策行事,因此基于案例推理更 符合人们的思维习惯 2 基于案例推理的保险欺诈案例分析系统的提出 从数据中挖掘出的信息会为保险业的决策提供重要的帮助,正如挪威著名保险学家卡尔 H 博尔奇指 出:“一般来说
11、,过去的赔款记录对于预测未来几年的赔款支 出具有重要作用 而且,不同的保险人之间对于这 些预测有着高度的一致性 ”由此可见保险历史数据对未来预测和启示作用是至关重要的 已经发现的保险欺诈案件,详细记录了大量欺诈数据,数据的信息包括所发生的保险事故(如车险中涉及 到的司机、车辆、时间、地点、证人、警察报告等信息)、索赔人(性别、年龄、职业和索赔 的历史记录等)、索赔信 息、受伤情况和医疗情况 长时问所积累的大量案例信息,如何管理利用为欺诈分析服务,是保险业面l 临的一个 既有挑战性又有重大价值的课题 由于欺诈行为非常复杂,很难用产生式规则系统来概述这些“经验知识”基 于案例推理分析系统技术的出现
12、,为构建保险欺诈案例分析系统提供了新 的思路 概括而言,基于案例推理技术,结合 X ML技术,我们按以下思路提出了保险欺诈案例分析系统:在案例表示 中,按险种和欺诈指示因子归纳出了近百个索引指标属性;案例内容用 X ML来描述;所有案例的存储管理以数 据仓库为平台,基于星型模式思想设计了符合案例管理的表结构 关于案例的检索,我们则设计了符合人们思 维习惯的综合检索模式,即根据需要组合模糊检索、模板检索、规则推理和相似性度量法来检索案例 根据案例 指标属性特点建立了相似性度量函数来测度目 标与案例库中案例的形似程度,中权值和指标是可选择的 3 基于案例推理的保险欺诈案例分析系统的设计 3 1 推
13、理 流程 保险欺诈案例分析系统推理的目标是基于已知疑点对象情况和分析人员的“愿望”从案例库搜索最相似的 案例,为疑点对象的约谈举证或检查提供有参照价值的启发内容 从实际工作需要出发,要求案例的搜索应更 符合人们的思维习惯,尽量做到定性与定量相结合、模糊与准确相结合、一般性与特殊性相结合,使系统能够根 据人员的描述情况搜索出最相似的案例 为此,我们综合应用模板检索、模糊检索、规则推理法、相似度量等几 种方法推理搜索 目标案例 推理搜索流程如图2所示 第 5期 孙锋:基于案例推理的保险欺诈案例分析系统设计 3 3 3 2 相似性 量度 范例的相似性度量有多种方式,N N算 法结合了领域知识,大多数
14、的 C B R系统都 采用该算法 设每个案例 由 个属性 定义:=,:,其中 是案 例的类别,也即决策维 给定一个查询(输 入)g和一个案例库 L,N N算法在 中检索 最为相似(即最“近”)的案例,并预言 q =Xc 新案例 q和历史案例 的全局相 似度定 义为:(w s S i m(x f,q s)O S U N(x,q)=上L ,=1 其中 是历史案例 q在属性厂上 的权值,S i m(,是新案例 q 和历史案例 X在属 性厂上的局部相似度 3 3,目 似 匹西 己 在保险欺诈案例分析系统的相似性匹 配中,已知疑点对象,然后从案例库中推理 搜索与之最相似的案例 欺诈行为是非常 复杂的,需
15、要定性、定量和逻辑分析判断来 从案例库 中搜索 出类似案例,相似匹配步 骤如下 1)步骤 1 图2 基于案例推理的保险欺诈分析系统 F i g 2 De s i g n o f C B R i n s u r a n c e f lr a u d c a s e a n a l y s i s s y s t e m 模糊搜索:根据疑点对象保险类型、投保时间、涉及 险种、疑点环节及案例行为特征关键词等定性条件,模糊搜索出类似的所有案例 模板搜索:模板搜索,即按保单指标 的一定逻辑条件来搜索 在系统 中,创建 了一个指标逻辑描述器,可 以对所有指标设置范围、指标间大小 比较及它们的“与”、“或”
16、逻辑组合,可实现很复杂的组合搜索条件描述 2)步骤 2 在长期的保险赔付实际工作和研究中,人们总结了许多具有规律性的案例分析内容 经过专家的提炼,在系统 中形成 了具有产生式专家系统特点的规则推理搜索,根据 I F条件来对步骤 1搜索出的案例和 目标疑 点对象进行规则推理分类 如:I F被保险人在多家人寿保险公司投保,且保险金额总和显示超过当地人的一般水平 T H E N存在明显疑点;I F被保险人获受益人有很大数额的到期债务或者经济状况明显恶化 T H E N存在明显疑点;I F死亡原因符合众所周知的自杀模式,如 自高楼坠落、高速驾驶车辆闪避对面车辆撞向路边墙壁、树木、水 中或者对面来车的
17、T H E N存在重大疑点;I F投保人在投保时告知不明,尤其是健康、职业、财务状况告知不实的 T H E N存在重大疑点 等等 3)步骤 3 根据步骤 2搜索出的案例,分析人员依据经验判断来选择相似性度量函数中的指标分量并给 出权值,然 闽江学院学报 第 2 9卷 后 由相似性度量函数筛选出最相似的 5个案例,以便进一步分析使用 3 4 案例 维护 案例维护,是保险欺诈案例分析系统非常重要的组成部分,它通过一定的维护步骤将实际工作 中产生的 新案例添加到案例库或用来修改完善库中的案例 具体步骤如下:步骤 1:根据案例的身份证号,获取其在一定时间范围内的报单数据和赔付数据 步骤 2:由 S t
18、 e p l获取的数据,抽取汇总案例索引属性数量向量 再根据案例描述内容,抽取案例描述内 容,并且用 X ML存储到数据库中,案例行为特征关键词构成 X ML的节点 步骤 3:将案例先看成“疑点对象”,通过案例推理从案例库 中搜索相似的案例,处理逻辑如下:I F存在相似案例 T H E N 通过人工分析判断,修改完善相似的案例 EL SE 将案例作为新案例添加到案例库中 END 通过上述 3步主要操作,完成 了案例库的维护工作 4结论 笔者开发了基于 B S的保险欺诈案例分析系统的原型,开发环境:I I S 5 0+A S P 3 0+J a v a S c r i p t;后台数 据库:M
19、S S Q L S e e r 2 0 0 0存放案例库 根据对某保险公司 2 0 0 7年 已发现的4 5例 的保险欺诈案例样本进行 测试,能发现 3 9个样本,有效性达到 8 6 该系统有效地减少 了保险理赔 中的主观随意性,并能很好地处理 业务中出现的“特例”;提高了公平性、公开性和工作效率,因此对防范保险欺诈起 到了一定的辅助作用 但 该系统仍有待完善的地方,比如范例修正、范例库增大时范例索引的维护及人机交互等问题,需要在今后的 研究中加以完善 参考文献:1 甘仞初 基于案例的系统 c 刘伯龙,蒋 白桦 中国管理信息系统研究与实践新进展 长沙:湖南大学出版社,1 9 9 5:3 2 7
20、 3 32 2 S c h a n k R C,D a v i d B L C r e a t i v i t y a n d l e a r n i n g i n a c a s e b a s e d e x p l a i n e r J A r t i fi c i a l I n t e l l i g e n c e,1 9 8 9,4 0(1 2 3):3 5 3 3 85 3 K o l o d n e r J L I m p r o v i n g h u m a n d e c i s i o n m a k i n g t h r o u g h c a s e d b
21、 a s e d r e a s o n i n g t e c h n i q u e s J A I M a g a z i n e,1 9 9 1,1 2(3):5 2 5 9 4 郭春燕 国内外保险欺诈研究现状分析 J 兰州学刊,2 0 0 6(9):1 5 41 4 7 5 O s b o r n e H R,B ri d g e D G S i m i l a r i t y m e t r i c s:a f o r m a l u n i f i c a t i o n o f c a r d i n al a n d n o n c a r d i n a l s i m i
22、 l a ri t y m e a s u r e s C L e a k e D B,Pl a z a E P r o c e e d i ng s o f S e c o nd I n t e rna t i on a l Co n f e r e nc e o n Case Base d Re as o ni ng,Le c t u r e No t e s i n Ar t i fic i a l I n t e l l i g e nc e 1 2 6 6 S p rin g e r 1 9 9 7:2 3 52 4 4 6 K ri e g s m a n M,B a r l e
23、t t a R B u i l d i n g a c a s e b a s e d h e l p d e s k a p p l i c a t i o n J I E E E E x p e rt,1 9 9 3,8(6):1 8 2 6 7 Wa t s o n I a n A p p l y i n g c ase b ase d r e a s o n i n g:t e c h n i q u e s f o r e n t e r p ri s e s y s t e ms M S a n M a t e o:Mo r g a n K a u f m a n n P u b
24、l i s h e m,1 9 9 7:2 23 2 8 A a mo d t A,P l a z a E C a s e b a s e d r e a s o n i n g:f o u n d a t i o n al i s s u e s,m e t h o d o l o g i c al v a r i a t i o n s,a n d s y s t e m a p p r o a c h e s J A I C o m A r t i fi c i a l I n t e l l i g e n c e C o mmu n i c a t i o n s,1 9 9 4,7:1,3 95 9 (责任编辑:唐诚煜)