《电子商务企业管理方案.ppt》由会员分享,可在线阅读,更多相关《电子商务企业管理方案.ppt(71页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第五章第五章电子商务企业管理电子商务企业管理方案方案 客户关系管理客户关系管理 供应链管理供应链管理 商务智能商务智能 客户关系管理简述客户关系管理简述CRM(Customer Relationship Management,客户关系管理客户关系管理),是正在兴起,是正在兴起的一种旨在健全、改善企业与客户之间关系的的一种旨在健全、改善企业与客户之间关系的新型管理系统新型管理系统 CRM核心思想是以核心思想是以“客户为中心客户为中心”,提高客户,提高客户满意度,改善客户关系,从而提高企业的竞争满意度,改善客户关系,从而提高企业的竞争力力 对对CRM的定义,目前还没有一个统一的表述。的定义,目前还
2、没有一个统一的表述。但就其功能来看,但就其功能来看,CRM是通过采用信息技术,是通过采用信息技术,使企业市场营销、销售管理、客户服务和支持使企业市场营销、销售管理、客户服务和支持等经营流程信息化,实现客户资源有效利用的等经营流程信息化,实现客户资源有效利用的管理软件系统管理软件系统 需求的拉动的冲击需求的拉动的冲击来自销售人员的声音来自销售人员的声音来自营销人员的声音来自营销人员的声音来自服务人员的声音来自服务人员的声音来自顾客的声音来自顾客的声音来自经理人员的声音来自经理人员的声音技术的推动技术的推动管理理念的更新管理理念的更新业务流程的重组(业务流程的重组(BPR)客户的重要性日益突出客户
3、的重要性日益突出网络化市场的主动权在客户方网络化市场的主动权在客户方CRM的产生的产生Internet和电子商务和电子商务多媒体技术多媒体技术数据仓库和数据挖掘数据仓库和数据挖掘人工智能和专家系统人工智能和专家系统呼叫中心及相应的硬件系统呼叫中心及相应的硬件系统专业咨询专业咨询真正的真正的CRM应做到应做到让客户更方便(让客户更方便(Convenient)让客户更亲切(让客户更亲切(Care)让客户更觉个性化(让客户更觉个性化(Personalized)实时反应(实时反应(real-time response)CRM作为解决方案作为解决方案CRM的主要内容的主要内容客户分析客户分析企业对客户的
4、承诺企业对客户的承诺客户信息交流客户信息交流一良好的关系留住客户一良好的关系留住客户客户反馈管理客户反馈管理CRM系统组成系统组成客户概况(客户概况(Profiling)分析子系统分析子系统客户利润(客户利润(Profitability)分析子系统分析子系统客户性能(客户性能(Performance)分析子系统分析子系统客户产品(客户产品(Product)分析子系统分析子系统客户忠诚度(客户忠诚度(Persistency)分析子系统分析子系统客户未来(客户未来(Prospecting)分析子系统分析子系统客户促销(客户促销(Promotion)分析子系统分析子系统CRM主要内容主要内容CRM与
5、与ERP的关系的关系客户关系管理模型客户关系管理模型客户关系管理的功能主要分为四大部分:客户关系管理的功能主要分为四大部分:客户信息管理客户信息管理:整合记录企业各部门、每个人所接整合记录企业各部门、每个人所接触的客户资料,并进行统一管理触的客户资料,并进行统一管理 市场营销管理:制订市场推广计划,并对各种渠道市场营销管理:制订市场推广计划,并对各种渠道接触的客户进行记录、分类和辨识,提供对潜在客接触的客户进行记录、分类和辨识,提供对潜在客户的管理,并对各种市场活动的成效进行评价户的管理,并对各种市场活动的成效进行评价 销售管理:包括对销售人员电话销售、现场销售、销售管理:包括对销售人员电话销
6、售、现场销售、销售佣金等管理,支持现场销售人员的移动通信设销售佣金等管理,支持现场销售人员的移动通信设备或掌上电脑接入备或掌上电脑接入 服务管理与客户关怀:功能包括产品安装档案、服服务管理与客户关怀:功能包括产品安装档案、服务请求、服务内容、服务网点、服务收费等管理信务请求、服务内容、服务网点、服务收费等管理信息,详细记录服务全程进行情况息,详细记录服务全程进行情况 CRM的典型功能的典型功能 IBM的的CRM解决方案解决方案 CRM解决方案的功能主要有三类:解决方案的功能主要有三类:接入管理接入管理:用来管理客户和企业进行交用来管理客户和企业进行交互的方式互的方式 CRMCRM流程管理流程管
7、理 :CRMCRM流程管理代表着与销流程管理代表着与销售、服务、支持和市场相关的业务流程的售、服务、支持和市场相关的业务流程的自动化,主要包括销售自动化自动化,主要包括销售自动化 、服务送、服务送达达 、产品支持、产品支持 和市场自动化和市场自动化 关系管理:关系管理:使用数据挖掘使用数据挖掘/数据仓库和复数据仓库和复杂的分析功能,杂的分析功能,贯穿于贯穿于CRMCRM解决方案关系解决方案关系管理的全过程,并具有全面的客户观念和管理的全过程,并具有全面的客户观念和客户忠诚度衡量标准和条件客户忠诚度衡量标准和条件 IBM CRM的主要内容的主要内容 客户关系管理客户关系管理 供应链管理供应链管理
8、 商务智能商务智能SCMSCM概念概念 供应链(供应链(supply chainsupply chain)定义为相互间定义为相互间通过提供原材料、零部件、产品、服务通过提供原材料、零部件、产品、服务的厂家、供应商、零售商等组成的网络的厂家、供应商、零售商等组成的网络 供应链管理(供应链管理(Supply Chain Supply Chain ManagementManagement)则是对供应链中的信息流、则是对供应链中的信息流、物流和资金流进行设计、规划和控制,物流和资金流进行设计、规划和控制,从而增强竞争实力,提高供应链中各成从而增强竞争实力,提高供应链中各成员的效率和效益员的效率和效益
9、SCMSCM帮助管理人员有效分配资源,最大限帮助管理人员有效分配资源,最大限度提高效率和减少工作周期度提高效率和减少工作周期 SCM与与ERP供应链管理供应链管理(SCM)应用是在企业资源管理应用是在企业资源管理(ERP)的基础上发展起来的的基础上发展起来的 ERP从概念上而言仅是对企业内部的资源从概念上而言仅是对企业内部的资源进行调配与平衡进行调配与平衡 SCM被作为被作为ERP的外延和补充提出来,因的外延和补充提出来,因为为SCM不仅包括资源接收、生产制造过程不仅包括资源接收、生产制造过程的管理,还涉及产品交付过程的管理,还涉及产品交付过程等管理等管理ERP是着重在交易处理(是着重在交易处
10、理(Transaction Base)的层面,的层面,SCM软件则着重在规划软件则着重在规划层面,而且它是从供应链的角度思考作整层面,而且它是从供应链的角度思考作整个供应链的管理个供应链的管理 SCMSCM的功能的功能 订订购购管管理理:管管理理客客户户各各种种订订购购情情况况,如如订货、收货、付款与否等订货、收货、付款与否等 需需求求管管理理:从从市市场场动动态态预预测测客客户户需需求求,以及材料补给计划等以及材料补给计划等 供供给给管管理理:管管理理材材料料供供应应商商的的供供给给情情况况,如库存情况、价格、供给能力等如库存情况、价格、供给能力等 制制造造管管理理:管管理理产产品品的的状状
11、况况,如如生生产产线线、生产量、物流管理等生产量、物流管理等 供应链流程观供应链流程观周期的观点周期的观点推拉的观点推拉的观点Dell供应链的推供应链的推/拉流程拉流程OracleOracle供应链管理系统主要包括:供应链管理系统主要包括:供应链计划供应链计划 供给管理供给管理 物料管理物料管理 销售定单管理销售定单管理 售后客户服务售后客户服务 质量管理质量管理 OracleOracle的供应链管理方案的供应链管理方案 客户关系管理客户关系管理 供应链管理供应链管理 商务智能商务智能核心业务与电子商务紧密结合核心业务与电子商务紧密结合 面向客户面向客户 个性化服务个性化服务 商业智能商业智能
12、 快速反应快速反应 智能电子商务的特征智能电子商务的特征 如果数据是金钱,商务智能可以如果数据是金钱,商务智能可以.Existing Data Assets产品或服务分析产品或服务分析降低成本降低成本分析利润分析利润发现销售机会发现销售机会目标市场目标市场/动态区隔动态区隔P=R-C什么是商务智能?什么是商务智能??商务智能指收集、转换、分析和发布数据的过程,商务智能指收集、转换、分析和发布数据的过程,目的是为了更好的决策。目的是为了更好的决策。?商务智能是指将数据转化为知识的过程。它包括捕商务智能是指将数据转化为知识的过程。它包括捕获和分析信息,交流信息,以及利用这些信息开发市获和分析信息,
13、交流信息,以及利用这些信息开发市场。场。DataInformationKnowledge商务智能在行业的应用商务智能在行业的应用银行银行?客户利润分析?分支行利润分析?交叉销售?信用风险管理?新产品推销?收费策略保险?欺诈管理?收费策略?目标市场活动?客户挽留?客户利润分析零售?地区/商店各种货物(品牌,分类等)销售业绩?定价和减价?市场篮子关系?市场需求预测?仓储规划通讯?客户忠实?客户流失模式?客户利润分析?竞争分析?欺诈管理数据仓库技术数据仓库技术 联机分析处理技术联机分析处理技术OLAPOLAP数据挖掘技术数据挖掘技术代理技术代理技术商务智能关键技术商务智能关键技术 数据仓库数据仓库数
14、数据据仓仓库库的的最最终终目目标标是是把把企企业业范范围围内内的的所所有有数数据据集集成成在在一一个个大大仓仓库库中中,让让用用户户能能运运行查询、产生报告、执行分析行查询、产生报告、执行分析“数据仓库之父数据仓库之父”Bill Inmon给的定义:给的定义:数数据据仓仓库库就就是是一一个个用用以以更更好好地地支支持持企企业业或或组组织织的的决决策策分分析析处处理理的的,面面向向主主题题的的,集集成成的的,不可更新的,随时间不断变化的数据集合不可更新的,随时间不断变化的数据集合数据仓库的特征数据仓库的特征面面向向主主题题的的:主主题题是是一一个个在在较较高高层层次次将将数数据据归归类类的的标标
15、准准,每每个个主主题题基基本本对对应应一一个个宏宏观观的的分分析析领域领域 集集成成的的:允允许许数数据据来来自自于于跨跨组组织织和和部部门门等等不不同同数数据据源源;集集成成的的数数据据必必须须是是一一致致的的、用用户户看看来来是统一的数据视图是统一的数据视图 不不可可更更新新的的:指指一一旦旦某某个个数数据据进进入入数数据据仓仓库库后后,一般情况下将被长期保留(反映历史数据内容)一般情况下将被长期保留(反映历史数据内容)随随时时间间不不断断变变化化:库库中中的的信信息息系系统统地地记记录录了了企企业从过去某一点到目前的各阶段的信息业从过去某一点到目前的各阶段的信息 数据仓库与数据库比较数据
16、仓库与数据库比较不同点:不同点:依据决策要求,只从数据库中抽取需要的数据,依据决策要求,只从数据库中抽取需要的数据,并进行一定的处理并进行一定的处理 数据仓库是多维的,即数据仓库的数据的组织数据仓库是多维的,即数据仓库的数据的组织 方式有多层的行和列方式有多层的行和列 支持决策处理(支持决策处理(OLAP),),不同于普通的事务处不同于普通的事务处 理(理(OLTP)需要的数据库知识需要的数据库知识 并行数据库技术:数据量很大并行数据库技术:数据量很大 高性能的数据库服务器:分析型的应用高性能的数据库服务器:分析型的应用 数据库互操作技术:数据来源多种多样数据库互操作技术:数据来源多种多样数据
17、仓库的体系结构数据仓库的体系结构 操作型数据源1 报告查询、应用开发和EIS 工具 操作型数据源2OLAP工具 n数据挖掘工具 仓库管理器 元数据高度综合数据 轻度综合数据 细节数据 集成管理器查询管理器操作型数据源n数据仓库建模数据仓库建模星型模式星型模式Example of Star SchemaDateMonthYearDateCustIdCustNameCustCityCustCountryCustSales Fact Table Date Product Store Customer unit_sales dollar_sales Yen_salesMeasurementsProdu
18、ctNoProdNameProdDescCategoryQOHProductStoreIDCityStateCountryRegionStore数据仓库建模数据仓库建模雪片模式雪片模式 DateMonthDateCustIdCustNameCustCityCustCountryCustSales Fact Table Date Product Store Customer unit_sales dollar_sales Yen_salesMeasurementsProductNoProdNameProdDescCategoryQOHProductMonthYearMonthYearYearCi
19、tyStateCityCountryRegionCountryStateCountryStateStoreIDCityStoreExampleofSnowflakeSchema操作型(操作型(OLTP)数据源数据源-销售库销售库星形模式星形模式时间维时间维事实表事实表多维模型多维模型事实事实度量度量(Metrics)时间维时间维时间维的属性时间维的属性联机事物处理联机事物处理OLTP系统和数据仓库的比较系统和数据仓库的比较典型的数据仓库解决方案典型的数据仓库解决方案IBM数据仓库解决方案数据仓库解决方案ORACLE数据仓库解决方案数据仓库解决方案SAS数据仓库解决方案数据仓库解决方案.IBM数
20、据仓库解决方案数据仓库解决方案建立数据仓库包括以下阶段:建立数据仓库包括以下阶段:数据抽取阶段:完成对各种数据源的访问数据抽取阶段:完成对各种数据源的访问数据转换阶段:完成对数据的清洗、汇总、整合数据转换阶段:完成对数据的清洗、汇总、整合数据分布阶段:完成对结果数据存储的分配数据分布阶段:完成对结果数据存储的分配 通常此三阶段紧密结合在一个产品中体现通常此三阶段紧密结合在一个产品中体现 数据仓库的存储:由数据仓库的存储:由DB2家族完成家族完成数据的呈现:由不同产品完成不同的分析要求数据的呈现:由不同产品完成不同的分析要求管理和维护数据仓库中的数据:管理和维护数据仓库中的数据:交给交给Visu
21、al WarehouseIBM数据仓库解决方案数据仓库解决方案IBM数据仓库解决方案数据仓库解决方案前前三三个个阶阶段段(抽抽取取、转转换换、分分布布):Visual Warehouse、Data Joiner、Date Propagator数据仓库的存储由数据仓库的存储由DB2家族产品来完成家族产品来完成IBM数据仓库解决方案数据仓库解决方案数据的呈现:数据的呈现:Approach可进行查询和统计分析可进行查询和统计分析IntelligentDecisionServer支持多维分析支持多维分析IntelligentMiner用于数据挖掘用于数据挖掘用用户户查查找找和和理理解解数数据据仓仓库库
22、中中的的数数据据:DataGuideORACLE数据仓库解决方案数据仓库解决方案ORACLE数据仓库解决方案是OracleOLAP产品。其示意图如下:OLAP应用程序OLAP工具OLAP Server数据源OracleSalesAnalyzerOracleFinancialAnalyzerOracleFinancialController第三方前端工具OracleExpressObjectsOracleExpressAnalyzerOracleExpress WebAgentOracleDiscovererOracle Express Server其他传统的和外部数据库关系型数据库管理系统OR
23、ACLE数据仓库解决方案数据仓库解决方案Oracle Express Server是是一一个个先先进进的的计算引擎和数据高速缓存计算引擎和数据高速缓存 Oracle 的的OLAP工工具具主主要要包包括括Oracle Express Objects、Oracle Express Analyzer和和Oracle Discoverer ORACLE数据仓库解决方案数据仓库解决方案Oracle Express Web Agent将将Oracle Express技技术术的的分分析析能能力力和和Web浏浏览览器器的简单性相结合的简单性相结合 Oracle Financial Analyzer,Oracl
24、e Financial Controller和和Oracle Sales Analyzer是是Oracle针针对对财财务务和和销销售售而而预预制的制的OLAP应用应用 联机分析处理(联机分析处理(OLAP)60年代,关系数据库之父年代,关系数据库之父E.F.Codd提出了关提出了关系模型,促进了联机事务处理系模型,促进了联机事务处理(OLTP)的发展的发展(数据以表格的形式而非文件方式存储数据以表格的形式而非文件方式存储)。1993年,年,E.F.Codd提出了提出了OLAP概念,认为概念,认为OLTP已不能满足终端用户对数据库查询分析已不能满足终端用户对数据库查询分析的需要,的需要,SQL对
25、大型数据库进行的简单查询也对大型数据库进行的简单查询也不能满足终端用户分析的要求。用户的决策分不能满足终端用户分析的要求。用户的决策分析需要对关系数据库进行大量计算才能得到结析需要对关系数据库进行大量计算才能得到结果,而查询的结果并不能满足决策者提出的需果,而查询的结果并不能满足决策者提出的需求。因此,求。因此,E.F.Codd提出了多维数据库和多维提出了多维数据库和多维分析的概念,即分析的概念,即OLAP。OLTP数据数据 OLAP数据数据 原始数据原始数据 导出数据导出数据 细节性数据细节性数据 综合性和提炼性数据综合性和提炼性数据 当前值数据当前值数据 历史数据历史数据 可更新可更新 不
26、可更新,但周期性刷新不可更新,但周期性刷新 一次处理的数据量小一次处理的数据量小 一次处理的数据量大一次处理的数据量大 面向应用,事务驱动面向应用,事务驱动 面向分析,分析驱动面向分析,分析驱动 面向操作人员,支持日面向操作人员,支持日 面向决策人员,支持管理需要面向决策人员,支持管理需要 常操作常操作OLTP和和OLAP的区别的区别定定义义1:OLAP(联联机机分分析析处处理理)是是针针对对特特定定问问题题的的联联机机数数据据访访问问和和分分析析。通通过过对对信信息息(维维数数据据)的的多多种种可可能能的的观观察察形形式式进进行行快快速速、稳稳定定一一致致和和交交互互性性的的存存取取,允允许
27、许管管理理决决策策人人员对数据进行深入观察。员对数据进行深入观察。定定义义2:OLAP(联联机机分分析析处处理理)是是使使分分析析人人员员、管管理理人人员员或或执执行行人人员员能能够够从从多多种种角角度度对对从从原原始始数数据据中中转转化化出出来来的的、能能够够真真正正为为用用户户所所理理解解的的、并并真真实实反反映映企企业业维维特特性性的的信信息息进进行行快快速速、一一致致、交交互互地地存存取取,从从而而获获得得对对数数据据的的更更深深入入了解的一类软件技术。了解的一类软件技术。(OLAP委员会的定义委员会的定义)OLAP的的目目标标是是满满足足决决策策支支持持或或多多维维环环境境特特定定的
28、的查查询询和和报报表表需需求求,它它的的技技术术核核心心是是“维维”这这个个概概念念,因因此此OLAP也也可以说是多维数据分析工具的集合。可以说是多维数据分析工具的集合。什么是什么是OLAP?1.维维:是是人人们们观观察察数数据据的的特特定定角角度度,是是考考虑虑问问题题时时的的一一类类属性,属性集合构成一个维属性,属性集合构成一个维(时间维、地理维等时间维、地理维等)。2.维维的的层层次次:人人们们观观察察数数据据的的某某个个特特定定角角度度(即即某某个个维维)可可以以存存在在细细节节程程度度不不同同的的各各个个描描述述方方面面(时时间间维维:日日期期、月月份、季度、年份、季度、年)。3.维
29、维的的成成员员:维维的的一一个个取取值值。是是数数据据项项在在某某维维中中位位置置的的描描述。述。(“某年某月某日某年某月某日”是在时间维上位置的描述是在时间维上位置的描述)4.多多维维数数组组:维维和和变变量量的的组组合合表表示示。一一个个多多维维数数组组可可以以表表示示为为:(维维1,维维2,维维n,变变量量)。(时时间间,地地区区,产产品,销售额品,销售额)5.数数据据单单元元(单单元元格格):多多维维数数组组的的取取值值。(2000年年1月月,上上海,笔记本电脑,海,笔记本电脑,$100000)相关基本概念相关基本概念(1)(1)快快速速性性:用用户户对对OLAPOLAP的的快快速速反
30、反应应能能力力有有很很高高的的要要求求。系系统应能在统应能在5 5秒内对用户的大部分分析要求做出反应。秒内对用户的大部分分析要求做出反应。(2)(2)可可分分析析性性:OLAPOLAP系系统统应应能能处处理理与与应应用用有有关关的的任任何何逻逻辑辑分分析和统计分析。析和统计分析。(3)(3)多多维维性性:多多维维性性是是OLAPOLAP的的关关键键属属性性。系系统统必必须须提提供供对对数数据据的的多多维维视视图图和和分分析析,包包括括对对层层次次维维和和多多重重层层次次维维的的完完全支持全支持(4)(4)信信息息性性:不不论论数数据据量量有有多多大大,也也不不管管数数据据存存储储在在何何处处,
31、OLAPOLAP系统应能及时获得信息,并且管理大容量信息。系统应能及时获得信息,并且管理大容量信息。OLAP特性特性多维视图多维视图 地北京 理多维数据视图 位上海 99 置 98 年广州 97 份 彩电 洗衣机 电冰箱产 品 类 型98971.1.超立方结构超立方结构(Hypercube)Hypercube)超超立立方方结结构构指指用用三三维维或或更更多多的的维维数数来来描描述述一一个个对对象象,每每个个维维彼彼此此垂垂直直。数数据据的的测测量量值值发发生生在在维维的的交交叉叉点点上上,数数据据空空间间的的各各个个部部分分都都有有相相同同的的维维属属性性。(收收缩缩超超立立方方结结构构:这这
32、种种结结构构的的数数据据密密度度更更大大,数数据据的的维维数数更更少少,并可加入额外的分析维并可加入额外的分析维)。2.2.多立方结构多立方结构(MulticubeMulticube)在在多多立立方方结结构构(Multicube)中中,将将大大的的数数据据结结构构分分成成多多个个多多维维结结构构。这这些些多多维维结结构构是是大大数数据据维维数数的的子子集集,面面向向某某一一特特定定应应用用对对维维进进行行分分割割,即即将将超超立立方方结结构构变变为为子子立立方方结结构构。它它具具有有很很强强的的灵灵活活性性,提提高高了了数数据据(特特别别是稀疏数据是稀疏数据)的分析效率的分析效率OLAP多维数
33、据结构多维数据结构OLAP多维数据分析多维数据分析对对以以多多维维形形式式组组织织起起来来的的数数据据,采采取取切切片片、切切块块、旋旋转转等等各各种种分分析析动动作作,以以求求剖剖析析数数据据,使使最最终终用用户户能能从从多多个个角角度度、多侧面地观察数据库中的数据多侧面地观察数据库中的数据 1.1.切片和切块切片和切块(Slice and DiceSlice and Dice)在在多多维维数数据据结结构构中中,按按二二维维进进行行切切片片,按按三三维维进进行行切切块块,可可得得到到所所需需要要的的数数据据。如如在在“城城市市、产产品品、时时间间”三三维维立立方方体体中中进进行行切切块块和和
34、切切片片,可可得得到到各各城城市市、各各产品的销售情况。产品的销售情况。2.2.钻取钻取(Drill)Drill)钻钻取取包包含含向向下下钻钻取取(Drill-down)Drill-down)和和向向上上钻钻取取(Drill-Drill-up)/up)/上上卷卷(Roll-upRoll-up)操操作作,钻钻取取的的深深度度与与维维所所划划分分的层次相对应。的层次相对应。3.3.旋转旋转(Rotate)/Rotate)/转轴转轴(Pivot)Pivot)通过旋转可以得到不同视角的数据。通过旋转可以得到不同视角的数据。数据分析方法数据分析方法OLAP的分析方法的分析方法(一一)切片、切块切片、切块
35、OLAP的分析方法的分析方法(二二)钻取钻取按按时时间间维维向向下下钻钻取取按按时时间间维维向向上上钻钻取取60OLAP的分析方法的分析方法(三三)旋转旋转数据组织形式数据组织形式RDB数据组织数据组织 -MDDB数据组织数据组织 -关系表中综合数据的存放关系表中综合数据的存放 多维数据库中综合数据的存放多维数据库中综合数据的存放 产品名称产品名称地区地区销售量销售量冰箱冰箱东北东北50冰箱冰箱西北西北60冰箱冰箱华北华北100彩电彩电东北东北40彩电彩电西北西北70彩电彩电华北华北80空调空调东北东北90空调空调西北西北120空调空调华北华北140东东北北西西北北华华北北冰冰箱箱506010
36、0彩彩电电407080空空调调90120140产品名称产品名称地区地区销售量销售量冰箱冰箱东北东北50冰箱冰箱西北西北60冰箱冰箱华北华北100冰箱冰箱总和总和210彩电彩电东北东北40彩电彩电西北西北70彩电彩电华北华北80彩电彩电总和总和190空调空调东北东北90空调空调西北西北120空调空调华北华北140空调空调总和总和350总和总和东北东北180总和总和西北西北250总和总和华北华北320总和总和总和总和750东北东北西北西北华北华北总和总和冰箱冰箱5060100210彩电彩电407080190空调空调90120140350总和总和180250320750OLAP体系结构体系结构数据挖
37、掘(数据挖掘(DataMining)数数据据挖挖掘掘(Data Mining),又又称称数数据据库库中中的的知知识识发发现现(Knowledge Discovery in Database,KDD),是是指指从从大大型型数数据据库库或或数数据据仓仓库库中中抽抽取取出出潜潜在在的的、有有价值的知识(模型或规则)的过程价值的知识(模型或规则)的过程数数据据挖挖掘掘的的目目的的:提提高高市市场场决决策策能能力力;检检测测异异常模式;在过去的经验基础上预言未来趋势等常模式;在过去的经验基础上预言未来趋势等数数据据挖挖掘掘不不同同的的术术语语和和定定义义:data data mining,mining,
38、knowledge knowledge discovery,discovery,pattern pattern discovery,discovery,data dredging,data archeology.data dredging,data archeology.数据挖掘过程数据挖掘过程选择选择转换转换挖掘挖掘理解理解转换后数据转换后数据抽取的信息抽取的信息可理解的信息可理解的信息选择的数据选择的数据数据仓库数据仓库数据挖掘过程模型数据挖掘过程模型1.定义商业问题定义商业问题2.建立数据挖掘模型建立数据挖掘模型3.分析数据分析数据4.准备数据准备数据5.建立模型建立模型6.评价模型评价
39、模型7.实施实施数据挖掘和数据仓库数据挖掘和数据仓库数据源数据源数据仓库数据仓库各各分分公公司司数数据集市据集市分析分析数据集市数据集市数据挖掘数据挖掘数据集市数据集市图图1:数据挖掘库从数据仓库中得出:数据挖掘库从数据仓库中得出数据源数据源数据挖掘库数据挖掘库图图2:数据挖掘库从事务数据库中得出:数据挖掘库从事务数据库中得出数据挖掘模式数据挖掘模式分类模式分类模式 关联模式关联模式顺序模式顺序模式聚类模式聚类模式回归模式回归模式时间序列模式时间序列模式分类分类 (Classification)方法:方法:首先从数据中选出已经分好类的训练集,在该训练集首先从数据中选出已经分好类的训练集,在该训
40、练集上运用数据挖掘分类的技术,建立分类模型,对于没上运用数据挖掘分类的技术,建立分类模型,对于没有分类的数据进行分类。有分类的数据进行分类。例子:例子:a.信用卡申请者,分类为低、中、高风险信用卡申请者,分类为低、中、高风险b.b.分配客户到预先定义的客户分片分配客户到预先定义的客户分片注意:注意:类的个数是确定的,预先定义好的类的个数是确定的,预先定义好的常用算法:常用算法:Decision tree induction、Neural networks、Genetic algorithms、K-Nearest neighbors 、Case based reasoning、Associati
41、on Rule Model、Decision Cluster model、Rough set classification model回归(估值回归(估值Estimation)方法方法 估值与分类类似,不同之处在于,分类描述的是离散型变估值与分类类似,不同之处在于,分类描述的是离散型变量的输出,而估值处理连续值的输出;分类的类别是确定量的输出,而估值处理连续值的输出;分类的类别是确定数目的,估值的量是不确定的。数目的,估值的量是不确定的。例子:例子:a.根据购买模式,估计一个家庭的孩子个数根据购买模式,估计一个家庭的孩子个数b.根据购买模式,估计一个家庭的收入根据购买模式,估计一个家庭的收入c
42、.估计估计real estate的价值的价值一般来说,估值可以作为分类的前一步工作。给定一些输一般来说,估值可以作为分类的前一步工作。给定一些输入数据,通过估值,得到未知的连续变量的值,然后,根入数据,通过估值,得到未知的连续变量的值,然后,根据预先设定的阈值,进行分类。例如:银行对家庭贷款业据预先设定的阈值,进行分类。例如:银行对家庭贷款业务,运用估值,给各个客户记分(务,运用估值,给各个客户记分(Score 01)。)。然后,然后,根据阈值,将贷款级别分类。根据阈值,将贷款级别分类。关联模式关联模式相关性分组或关联规则(相关性分组或关联规则(Affinity grouping or ass
43、ociation rules)两种常用的技术是两种常用的技术是关联规则关联规则和和序列模式序列模式。关关联联规规则则是是寻寻找找在在同同一一个个事事件件中中出出现现的的不不同同项项的的相相关性;序列模式寻找的是事件之间时间上的相关性关性;序列模式寻找的是事件之间时间上的相关性 例子:例子:a.超市中客户在购买超市中客户在购买A的同时,经常会购买的同时,经常会购买B,即即A=B(关联规则关联规则)b.b.客户在购买客户在购买A后,隔一段时间,会购买后,隔一段时间,会购买B(序列分序列分析)析)聚类(聚类(Clustering)方法方法 聚类是对记录分组,把相似的记录在一个聚类聚类是对记录分组,把
44、相似的记录在一个聚类里。聚类和分类的区别是聚类不依赖于预先定里。聚类和分类的区别是聚类不依赖于预先定义好的类,不需要训练集。义好的类,不需要训练集。例子:例子:a.一些特定症状的聚类可能预示了一个特定的疾病一些特定症状的聚类可能预示了一个特定的疾病b.租租VCD类型不相似的客户聚类,可能暗示成员属类型不相似的客户聚类,可能暗示成员属于不同的亚文化群于不同的亚文化群聚类通常作为数据挖掘的第一步。例如,聚类通常作为数据挖掘的第一步。例如,“哪哪一种类的促销对客户响应最好?一种类的促销对客户响应最好?”,对于这一,对于这一类问题,首先对整个客户做聚类,将客户分组类问题,首先对整个客户做聚类,将客户分
45、组在各自的聚类里,然后对每个不同的聚类,回在各自的聚类里,然后对每个不同的聚类,回答问题,可能效果更好。答问题,可能效果更好。数据挖掘典型方法数据挖掘典型方法-神经网络神经网络一一个个神神经经网网络络划划分分为为输输入入层层、输输出出层层和和隐隐含含层层。输输入入层层的的每每个个节节点点对对应应一一个个个个的的预预测测变变量量。输输出出层层的的节节点点对对应应目目标标变变量量,可可有有多多个个。在在输输入入层层和和输输出出层层之之间间是是隐隐含含层层(对对神神经经网网络络使使用用者者来来说说不不可可见见),隐隐含含层层的的层层数数和和每每层节点的个数决定了神经网络的复杂度层节点的个数决定了神经
46、网络的复杂度神经网络常用于两类问题:分类和回归神经网络常用于两类问题:分类和回归123456输入输入输出输出隐含层隐含层 一个神经元网络一个神经元网络数据挖掘典型方法数据挖掘典型方法-决策树决策树收入¥40,000工作时间5年高负债高风险低风险高风险低风险否否否是是是 一棵简单的决策树决决策策树树中中最最上上面面的的节节点点称称为为根根节节点点,是是整整个个决决策策树树的的开开始始。每每个个分分支支要要么么是是一一个个新新的的决决策策节节点点,要要么么是是树树的的结结尾尾,称称为为叶叶子子。在在沿沿着着决决策策树树从从上上到到下下遍遍历历的的过过程程中中,在在每每个个节节点点都都会会遇遇到到一
47、一个个问问题题,对对每每个个节节点点上上问问题题的的不不同同回回答答导导致致不不同同的的分分支支,最最后后会会到到达达一一个个叶叶子子节节点点。这这个个过过程程就就是是利利用用决决策策树树进进行行分分类类的的过过程程,利利用用几几个个变变量量(每每个个变变量量对对应应一一个个问问题题)来来判判断断所所属属的的类类别别(最最后后每每个叶子会对应一个类别)个叶子会对应一个类别)数据挖掘和联机分析处理数据挖掘和联机分析处理OLAPOLAP是是决决策策支支持持领领域域的的一一部部分分。传传统统的的查查询询和和报报表表工工具具是是告告诉诉你你数数据据库库中中都都有有什什么么(what what happ
48、enedhappened),OLAPOLAP则则更更进进一一步步告告诉诉你你下下一一步步会会怎怎么么样样(What What nextnext)、和和如如果果我我采采取取这这样样的的措施又会怎么样(措施又会怎么样(What ifWhat if)OLAPOLAP方方法法先先建建立立一一系系列列的的假假设设,然然后后通通过过OLAPOLAP来证实或推翻这些假设来最终得到自己的结论来证实或推翻这些假设来最终得到自己的结论OLAPOLAP分析过程在本质上是一个分析过程在本质上是一个演绎推理演绎推理的过程的过程数数据据挖挖掘掘是是在在数数据据库库中中自自己己寻寻找找模模型型 ,在在本本质上是一个质上是一个归纳归纳的过程的过程 数据挖掘和数据挖掘和OLAPOLAP具有一定的互补性具有一定的互补性 代理技术代理技术基于代理技术的电子商务应用基于代理技术的电子商务应用 IBMIBM智能商务解决方案智能商务解决方案