《数据仓库概论课件.ppt》由会员分享,可在线阅读,更多相关《数据仓库概论课件.ppt(40页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第1页,此课件共40页哦1、数据库到数据仓库的演变第2页,此课件共40页哦第3页,此课件共40页哦31248第4页,此课件共40页哦顾客售票终端机票信息第5页,此课件共40页哦顾客信息航班信息机票信息第6页,此课件共40页哦顾客信息第7页,此课件共40页哦航班信息第8页,此课件共40页哦机票信息第9页,此课件共40页哦打印机票第10页,此课件共40页哦随着时间的推移第11页,此课件共40页哦每个月、每个季度机票销售量和销售额对顾客人群进行分类分析那些航班是热线,在什么时候是热线第12页,此课件共40页哦数据库数据库数据仓库数据仓库第13页,此课件共40页哦数据库到数据仓库的演变会导致蜘蛛网问题
2、第14页,此课件共40页哦第15页,此课件共40页哦数据分析的结果缺乏可靠性数据分析的结果缺乏可靠性例子:某电信公司的市场部和业务部对于业务A是否具有市场前景的分析结果相反。市场部:市场前景很好计划部:没有市场前景第16页,此课件共40页哦原因一:市场部门抽取大客户对业务A的使用情况;而计划部抽取了普通客户的使用情况。原因二:市场部分析时间是某年3月5日,而计划部是3月25日,导致在数据库中抽取数据的时间不同,因而分析的结果也不同。第17页,此课件共40页哦第18页,此课件共40页哦数据处理的效率很低数据处理的效率很低在复杂的体系结构中,不同级别的数据库使用不同数据库系统,抽取、集成都很麻烦。
3、动用大量人力、物力、时间完成报表。时效性差、效率低。第19页,此课件共40页哦计费数据库销售数据库账务数据库报表1报表2报表3第20页,此课件共40页哦难以将数据转化成信息例子:某电信公司想分析某个大客户今年的情况与过去3年有什么不同?大客户的情况包括:呼叫行为、话费情况、交费情况、咨询问题等。要把多方面的数据综合成信息。但是,记录呼叫行为的数据库通常保留3个月记录。账务数据库可能保留1年。客户咨询数据库保留客户2年的数据。因此完整的信息根本无法提取。第21页,此课件共40页哦操作型系统和分析型系统的分离解决蜘蛛网问题的途径解决蜘蛛网问题的途径第22页,此课件共40页哦操作型处理:以传统数据库
4、为中心,进行日常业务处理。举例:银行数据库用于记录客户的账号、密码、存入和支出等一系列业务行为。第23页,此课件共40页哦分析型处理:以数据仓库为中心,分析数据背后的关联和规律。举例:通过对超市近期数据分析可以发现近期畅销商品,从而指导采购。操作型系统和分析型系统的分离使得以前以数据库为中心的数据环境发展成为“双核”系统。第24页,此课件共40页哦操作型系统使用人员:企业具体操作人员处理的数据:企业业务的细节信息目标:实现企业的业务经营分析型系统使用人员:决策者包含的信息:宏观信息,非细节目的:提供支持信息第25页,此课件共40页哦数据仓库系统的功能和构成业务数据库提取、清洗、转换数据存储OL
5、AP数据挖掘企业决策层数据仓库决策支持多维查询预测第26页,此课件共40页哦企业级的多维信息查询数据仓库中的信息是企业级的整体信息,并支持多维度查询。例子:19992010年之间“华东区”的“机械类”产品。包括了时间维度、地理维度、产品类型维度。第27页,此课件共40页哦OLAP在线分析处理用直观的表格或图形等方式,多维度观察。例子:显示某公司在1995年2000年间,中国各省的销售值。199519961997199819992000山西福建宁夏30002003500400050006000400800900400036806003000第28页,此课件共40页哦数据挖掘发现系统中诸多因素间有
6、指导意义的关系。例子:“啤酒与尿布”英国某超市使用数据挖掘技术发现:周末,购买啤酒的年轻男性也常常购买小孩的尿布。看似毫无道理,实际因为年轻男子周末看球爱喝啤酒,为了同时显示对小孩和太太的关心,尽一些义务,就会买尿布。发现这一规律,超市把啤酒和尿布相邻摆放,方便顾客,促进销售。第29页,此课件共40页哦预测通过历史积累的信息以及发现的规律预测事务发展的趋势。例子:通过19902000年中国移动用户的数量信息来预测2001年用户增长的情况,提供决策依据。第30页,此课件共40页哦仓库的应用前景仓库的应用前景在客户服务及营销方面的应用现代商业竞争激烈,客户群体庞大,客户对服务的要求越来越高。客户关
7、系管理(CRM)是一个重要课题,实际上是基于数据仓库进行的。第31页,此课件共40页哦Sybase公司认为不同行业的CRM,有80%的共性功能。这些功能包括7个模块(7P)u客户概况分析:客户的层次、风险、爱好、习惯;u客户忠诚度分析:客户对某个产品或商业机构的忠实程度、持久性、变动情况等;u客户利润分析:指不同客户所消费第32页,此课件共40页哦u客户性能分析:指不同客户所消费的产品按种类、渠道、销售地点等指标划分的销售额;u客户未来分析:包括客户数量、类别等情况的未来发展趋势、争取客户的手段等;u客户产品分析:包括产品设计、关联性、供应链等;u客户促销分析:包括广告、宣传等促销活动的管理。
8、第33页,此课件共40页哦在银行领域的应用市场经济带来了银行对各种金融变量控制的随机性和模糊性。经营风险防范、科学管理、正确决策是很重要的课题。银行决策支持系统=银行管理信息系统+银行数据库+银行数据仓库+各种模型库、方法库和知识库。第34页,此课件共40页哦数据仓库技术在银行业的发展现状:基本上涵盖了银行经营管理与业务运作的各个方面。现在国内几大商业银行都在着手调研、准备或者尝试实施基于数据仓库技术的各种解决方案。第35页,此课件共40页哦比如,中国工商银行进行了以个人客户关系管理(PCRM)和业绩价值管理(PVMS)为主题的应用试点,中国银行则全面规划了信用卡系统,其中很重要的一个子系统就
9、是基于数据仓库技术的销售和客户服务系统,中国农业银行正在广东分行进行经营分析系统的建设,中国民生银行也全面启动了客户信息管理(CIM)和企业级数据仓库的建设。第36页,此课件共40页哦例子:中国工商银行PCRM应用主题银行卡应用重点客户分析:基本信息查询、存款余额分析、用卡行为分析、贡献度分析、透支分析(透支余额、单笔透支余额、单次透支金额、还贷周期)第37页,此课件共40页哦客户群分析:优质客户排名分析、卡业务存款分析、用卡行为分析、贡献度分析、卡申领情况分析、卡业务风险分析银行卡客户贡献度问题:按照现有的贡献度指标体系,什么样的客户对银行卡的贡献度最高?第38页,此课件共40页哦答案:通过数据挖掘,年龄在25-35、36-45的客户贡献度最高。这类人中,稳定,高收入或者高积蓄者较多。第39页,此课件共40页哦在保险业的应用商业保险公司业务系统的日趋完善,数据交换和处理中心的建立,数据仓库技术、联机分析处理技术的成熟,internet的普及,加速了决策支持的实用化过程。第40页,此课件共40页哦