银行POS收单业务的数据分析和研究_申璐.pdf

上传人:qwe****56 文档编号:69624056 上传时间:2023-01-07 格式:PDF 页数:3 大小:255.33KB
返回 下载 相关 举报
银行POS收单业务的数据分析和研究_申璐.pdf_第1页
第1页 / 共3页
银行POS收单业务的数据分析和研究_申璐.pdf_第2页
第2页 / 共3页
点击查看更多>>
资源描述

《银行POS收单业务的数据分析和研究_申璐.pdf》由会员分享,可在线阅读,更多相关《银行POS收单业务的数据分析和研究_申璐.pdf(3页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、*2010-08-20 收到,2010-10-29 改回*申璐,女,1985年生,硕士研究生,研究方向:数据分析。文章编号:1003-5850(2010)12-0018-03银行POS 收单业务的数据分析和研究Data Analysis and Research of Bank POS Acquiring Business申璐杨社堂曹新民(太原理工大学计算机科学与技术学院太原030024)【摘要】阐述了从银行卡POS 收单业务系统、外部数据源提取数据,过滤和归一数据,建立多维模型的数据仓库,进行信息处理、OLAP 分析和数据挖掘的过程。通过分析商户特征,有目标地发展特约商户,实现银行手续费收益

2、最大化。【关键词】特约商户,POS 交易数据,多维模型,数据仓库,OLAP,决策树挖掘中图分类号:TP274文献标识码:AABSTRACTThis paper expounds process of extracting data from the operational systems and external data sources,filtering andnormalization data,establishing the data warehouse of the multi-dimensional model and OLAP analyzing and data mining

3、.Byanalyzing the business characteristics,recruiting with objective special merchants,maximum clearing fee revenue of the bank couldbe achieved.KEYWORDSspecial merchants,POS transaction data,multi-dimensional model,data warehouse,OLAP,decision tree mining银行业数据管理应用的普遍现状是“数据爆炸而知识匮乏”。银行数据库中储存了大量特约商户(指与

4、银行签订受理卡业务协议并同意用银行卡进行商务结算的商户)的POS 交易(历史)数据,但是在银行管理业务中这些数据没有被充分利用,更难以针对不同商户采取更加灵活、更加有效的促销手段,引导和刺激持卡人刷卡消费,实现银行中间收入的增加。根据特约商户的POS 交易数据,建立多维模型的数据仓库,运用OLAP 和数据挖掘技术实现知识化。按照知识化过程最终要实现两大方面:运用数据挖掘技术中的决策树技术对商户进行分类,从中总结出每类商户的特征,有重点地发展符合既定客户群消费习惯的商户。银行可以评价出不同商户的贡献度,加强与重点商户的合作 1。1数据选择与处理1.1数据选择根据分析需求,首先需要能表现出商户基本

5、特征的数据,其次要统计商户的贡献度,需要商户交易情况的明细和手续费费率的执行标准。商户资料基本情况表。即商户的基本信息和刷卡消费的结算手续费标准。包括商户编码、商户名称、商户类别码、结算账号、受理银行卡的手续费收费标准(本行卡、他行卡)等。商户POS 交易流水表。即各商户银行卡刷卡消费的(历史)交易数据。与需求处理有关的是:交易系统跟踪号、商户名称、商户编码、商户类别码(MCC 码)、所属商户的刷卡交易的POS 号、交易日期、交易卡号、卡归属(本行卡、他行卡)、卡类别(信用卡、借记卡)、交易金额、交易的中间收入等银行卡的交易数据。商户的手续费费率执行标准。即根据商户类别需要收取的交易手续费。包

6、括商户类别码、商户类别、商户大类、手续费 2。1.2数据的处理1.2.1数据的归一化数据的归一化处理主要是将特约商户的POS 交易数据和商户资料中的相同属性进行统一处理。商户编码保存了银联编码和本行商户编码两种形式,为了防止混乱统一为本行商户编码。1.2.2数据的过滤对准备加载到数据仓库中的数据进行正确性判断,将那些数据格式不匹配的数据进行修改、净化处理。有些日期是以文本格式表示的,将其转化为日期格式。1.2.3数据的预算与推导为了提高数据仓库使用者的使用频率,在数据仓库中需要事先对信息使用者的常规操作进行预算和推导,这些预算与推导的结果作为预处理数据同时进入数据仓库。按照商户的收取手续费标准

7、和交易金额,可以预算和推导出商户的手续费收入,计算对银行的绝对贡献和贡献度。1.2.4数据的翻译与格式化数据源中的数据有些是以特定的符号来表示特定含义的,需要对其进行翻译。对收费标准的表示,用不18(总946)银行POS收单业务的数据分析和研究2010 年同的符号来分别表示固定比率、固定比率和封顶金额。为了方便操作必须对其进行翻译 3。2星型模型的设计确定了POS 交易数据分析的需求,根据交易数据分析的主题建立星型模型,确定事实表和维度表。事实表模型:POS 交易数据(交易系统跟踪号、商户编码、POS号、交易时间、交易卡号、卡归属、卡类别、交易金额、交易手续费),其中交易金额和交易手续费为度量

8、值。维度表模型:时间维度表(年、月、日)。卡归属维度表(本行卡、他行卡)。卡类别维度表(借记卡、信用卡)。商户信息维度表(商户编码、商户类别、结算账号、手续费收费情况、日均交易金额、日均交易笔数)。商户的手续费率执行标准表(商户类别、商户类别、商户大类、手续费)。3数据仓库的实现与数据分析技术一个完整的数据仓库系统包含几个部分:源数据、ETL、数据仓库、数据库、多维数据集等。其中最关键的 是ETL,即 数 据 抽 取(Extraction)、转 换(T ransformation)、装载(Load)。ETL 过程的准确、高效是保证一个数据仓库数据准确、正常运行的关键。在此采用Microsoft

9、 公司的SQL Server2000 数据开发应用工具,它已经在性能和可扩展性方面确立了领先的地位,是一套安全的数据库和数据分析解决方案。3.1数据转换工具Microsoft SQL Server 2000 提供了数据转换工具。即 数 据 转换 访 问 DTS(Data TransformationServices),是SQL Server 中提供的一项功能强大的技表1数据仓库开发工具数据仓库工具名称在数据仓库中的作用关系型数据库数据仓库的创建和维护数据转换工具数据仓库的数据加载数据复制工具分布式数据仓库的数据发布、加载OLE DB应用系统与数据源的接口Analysis Service数据挖掘

10、与分析Eng lish Query数据仓库的语言查询Meta Data Service数据仓库的元数据浏览PivotTable客户端多维数据的定制与操作术,它允许用户从不同的源中导入、导出和转换数据。3.2数据分析技术OLAP将OLAP 功能集成到Microsoft SQL Server 中,提供了可扩充的基于COM 的OLAP 接口。它是基于数据仓库的一种多维数据分析技术。OLAP 委员会对 OLAP 的定义是,使分析人员、管理人员或执行人员能够从多种角度对从原始数据转换而来的、能够真正为用户所理解的、并真实反映企业维特性的信息进行快速、一致、交互地存取,从而获得对数据更深入理解的一类软件技

11、术 4。3.3数据分析技术决策树挖掘技术这 里采用 Microsoft SQL Server2000 AnalysisServices 中的决策树技术来进行分析,因为决策树技术是利用最广泛的分类技术。首先,决策树方法结构简单,便于人们理解;其次,决策树模型效率高,对训练集数据量较大的情况较为适合;第三,决策树方法通常不需要受训数据外的知识;第四,决策树方法具有较高的分类精确度。4数据的知识化4.1信息处理信息处理是支持查询、基本的统计分析,并使用交叉表、表、图表或图进行报告。在此主要根据商户的交易数据,可以按月统计出POS 交易的走势。如图2 所示。图2POS 按月交易的走势4.2OLAP 分

12、析OLAP 展现在用户面前的是一幅幅多维视图。OLAP 的多维分析就是指对多维数据集中的数据用切19第23 卷第12 期电 脑 开 发 与 应 用(总 947)片、切块、翻转和旋转等方式分析数据,最终实现多角度、多侧面地去观察数据仓库中的数据,这样才能深入地挖掘隐藏在数据背后的商业模式。图3以时间、商户、卡类别三个维度所构成的多维数据集4.3数据挖掘(DM)数据挖掘是从存放在数据库、数据仓库或其他信息库中的大量数据中挖掘有趣知识的过程。支持知识发现,包括找出隐藏的模式和关联。通过构造分析模型,进行分类和预测,并用可视化工具提供挖掘结果。数据挖掘模型的建立:首先确定输入变量和目标变量,进入决策树

13、的输入变量有商户类别、手续费收费标准(本行的卡在本行的POS 机上刷卡消费)、手续费收费标准(其他行的卡在本行的POS 机上刷卡消费)、日均交易金额、日均交易笔数。输出变量是把商户分成优质商户、潜在商户、一般商户。手续费标准分成:1 类:按百分比收取。2 类:按百分比和最高限额收取。从这个决策树中,可以对商户有一个分类。很容易得到“IF-THEN”形式的分类规则,其方法是沿着由根节点到树叶节点的路径,路径上的每一个属性值对可以形成“IF”部分的一个合取项,树叶节点包含类预测,形成“T HEN”部分。每一条路径可以创建一个规则。图可以转换为以下形式的分类规则。IF 手续费标准=“1 类”AND

14、日均交易笔数=“大于 100 笔”AND 日交易金额=“大于等于500 元”AND 批发类、商场=“是”T HEN 类别标记=“优质商户”IF 手续费标准=“2 类”AND 房地产、汽车销售=“是”THEN 类别标记=“优质商户”IF 手续费标准=“1 类”AND 日均交易笔数=“大于等于 100 笔”AND 日交易金额=“小于500 元”AND 超市=“是”T HEN 类别标记=“优质商户”IF 手续费标准=“1 类”AND 日均交易笔数=“小于100 笔”AND 日交易金额=“大于500 元”AND航空售票、保险类=“是”T HEN 类别标记=“优质商户”IF 手续费标准=“1 类”AND

15、 日均交易笔数=“大于等于 100 笔”AND 日交易金额=“小于500 元”AND 超市=“否”T HEN 类别标记=“一般商户”IF 手续费标准=“1 类”AND 日均交易笔数=“小于100 笔”AND 日交易金额=“大于500 元”AND航空售票、保险类=“否”T HEN 类别标记=“一般商户”IF 手续费标准=“1 类”AND 日均交易笔数=“小于100 笔”AND 日交易金额=“小于500 元”AND百货类=“是”THEN 类别标记=“一般商户”。通过这个规则可以评估出哪类商户是优质商户,是增加中间收入的重点商户,需要重点维护。评估出哪类商户是潜在商户,要通过采用营销手段来争取成为优

16、质商户,增加对银行的贡献。5结束语本文给出了分析银行POS 交易数据和商户基本信息所采用的方法。银行业应用数据仓库和数据挖掘技术来进行有效的数据分析和针对性地进行目标商户拓展,将为银行赢得市场的同时实现其利润目标。参 考 文 献 1康雷宇.数据挖掘推动银行卡业务发展J.中国城市金融,2004(12):33-35.2关莉莉.银行卡客户群体聚类挖掘研究J.微计算机信息,2008(24):142-144.3王炜.银行卡业务数据挖掘应用J.福建电脑,2007(6):164-165.4王彩,唐慧佳.基于数据仓库和OLAP 技术的故障分析应用研究 J.铁路计算机应用,2007(6):35-37.5陈京民.数据仓库原理、设计与应用M.北京:中国水利水电出版社,2004.6Claude Seidman.SQL Server2000 数据挖掘技术指南M.北京:机械工业出版社,2002.20(总948)银行POS收单业务的数据分析和研究2010 年

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > 财经金融

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁