《商业智能实施方案培训资料.ppt》由会员分享,可在线阅读,更多相关《商业智能实施方案培训资料.ppt(25页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、A business of20222022年年年年1212月月月月9 9日日日日第一页,共25页。21、实施(shsh)方法?规划规划解决方案支持数据仓库管理(处理流程与操作)物理数据库设计数据转换应用开发数据挖掘服务设计与实现设计与实现支持与增强支持与增强解决方案体系结构设计元数据管理数据仓库评估应用增强逻辑数据模型回顾物理数据库回顾性能调整容量规划解决方案集成定制解决方案规划详细数据分析解决方案准备就绪解解决决方方案案实实施施建建议议现成解决方案规划数数据据仓仓库库策策略略开开发发业务探索业务探索解决方案定义逻辑数据模型设计修改逻辑数据模型验证解决方案数据仓库的循环过程第二页,共25页。3
2、2、实施(shsh)步骤数据仓库管理(gunl)物理(wl)数据模型数据转换应用开发数据挖掘服务系统体系结构设计元数据管理解决方案集成项目具体实施步骤项目前期准备业务探索信息探索逻辑数据模型1.项目前期准备2.业务探索(Business Discovery)3.信息探索(Information Discovery)4.逻辑数据模型设计5.系统体系结构设计6.物理数据库设计7.数据转换加载ETL8.前端应用开发9.数据挖掘服务10.元数据管理11.数据仓库管理(处理流程与操作)12.解决方案集成(测试验收与试运行)第三页,共25页。42.1 项目前期准备(zhnbi)主要任务:主要任务:项目启动
3、会议项目启动会议(Kick-off Meeting)(Kick-off Meeting)确认项目范围和主要目标确认项目范围和主要目标 确认项目阶段性验收及总体验收确认项目阶段性验收及总体验收标准标准 确认项目实施计划确认项目实施计划 成立项目组成立项目组 确定各项目小组的成员及各自的确定各项目小组的成员及各自的工作职责工作职责 确定各项目小组的阶段性工作目确定各项目小组的阶段性工作目标标 确定教育训练计划确定教育训练计划 确定服务流程及方式确定服务流程及方式(fngsh)(fngsh)交付项目:交付项目:项目组织机构项目组织机构项目人员组成项目人员组成 项目前期准备(zhnbi)业务探索信息探
4、索逻辑数据模型第四页,共25页。52.2 业务(yw)探索(Business Discovery)主要任务:主要任务:确定重点用户与数据源确定重点用户与数据源 用户需求调研与确认用户需求调研与确认 数据源确认数据源确认 用户需求和数据源的筛选用户需求和数据源的筛选(shixun)(shixun)和分析和分析 交付项目:交付项目:业务需求说明书业务需求说明书BRL(Business Requirement List BRL(Business Requirement List)概念数据模型概念数据模型CDM CDM(Conceptual Data Conceptual Data Model)Mod
5、el)项目前期准备(zhnbi)业务探索信息探索逻辑数据模型第五页,共25页。62.3 信息(xnx)探索(Information Discovery)主要任务:主要任务:分析用户需求分析用户需求 数据源分析数据源分析 进行工具评估进行工具评估 系统安全性设计系统安全性设计 系统命名规范设计系统命名规范设计交付项目:交付项目:功能功能(gngnng)(gngnng)需求列表需求列表FRL(Function FRL(Function Requirement List)Requirement List)系统安全性设计说明书系统安全性设计说明书 系统命名规范说明书系统命名规范说明书数据质量分析数据质
6、量分析项目前期准备(zhnbi)业务探索信息探索逻辑数据模型第六页,共25页。72.4 逻辑(lu j)数据模型设计主要任务:主要任务:进行原始数据分析进行原始数据分析 建立实体模型建立实体模型 建立实体间依赖关系建立实体间依赖关系 完善完善(wnshn)(wnshn)并填入所有属并填入所有属性性 建立数据库逻辑模型建立数据库逻辑模型 利用工具:利用工具:Erwin/Power Designer Erwin/Power Designer交付项目:交付项目:数据仓库逻辑数据模型数据仓库逻辑数据模型LDMLDM逻辑数据模型说明书逻辑数据模型说明书项目前期准备(zhnbi)业务探索信息探索逻辑数据模
7、型第七页,共25页。82.4 逻辑(lu j)数据模型概念逻辑数据模型是用来发现、记录和沟通逻辑数据模型是用来发现、记录和沟通(gutng)(gutng)业务的详细业务的详细“蓝图蓝图”基于概念数据模型(CDM)由一系列表和实体详细描述组成通用的业务语言便于业务与业务之间的功能理解集成当前和未来数据的蓝图(lnt)独立于技术为物理数据库设计作准备是IT人员和业务人员沟通的工具发现发现属性属性发现发现关系关系发现发现实体实体1.1.业务规则业务规则2.ER2.ER图图3.ERA3.ERA建模建模第八页,共25页。92.4 逻辑(lu j)数据模型(LDM)示例第九页,共25页。102.5 系统(
8、xtng)体系结构设计主要任务:主要任务:对业务、技术环境及企业文化对业务、技术环境及企业文化(wnhu)(wnhu)的的充分了解,从技术、组织、教育和支持充分了解,从技术、组织、教育和支持等方面对系统进行全面评估等方面对系统进行全面评估定义业务驱动力定义业务驱动力定义数据仓库成功的关键因素定义数据仓库成功的关键因素定义数据仓库的实施原则定义数据仓库的实施原则对系统体系结构各个组件进行详细设计对系统体系结构各个组件进行详细设计交付项目:交付项目:系统体系结构设计说明书系统体系结构设计说明书数据仓库管理(gunl)物理数据模型数据转换应用开发数据挖掘服务系统体系结构设计元数据管理解决方案集成第十
9、页,共25页。112.5 体系结构设计(shj)组件用户类型拓扑结构网络存取与互连组织机构安全性数据体系结构逻辑数据模型元数据数据质量命名规范数据采集与转换用户存取及工具(gngj)备份系统操作管理第十一页,共25页。122.6 物理(wl)数据库设计主要任务:主要任务:转换逻辑数据模型(转换逻辑数据模型(LDMLDM)为物理数据模型)为物理数据模型定义主索引、次索引定义主索引、次索引非正则化处理非正则化处理(chl)(chl)数据库建立数据库建立设计优化设计优化数据库功能测试数据库功能测试使用工具:使用工具:ERWwinERWwin交付项目:交付项目:物理数据模型(物理数据模型(LDMLDM
10、)物理数据模型说明书物理数据模型说明书数据库描述语言数据库描述语言DDLDDL建模方法:建模方法:第三范式第三范式 3NF 3NF 星型结构星型结构(jigu)(jigu)雪花状结构雪花状结构(jigu)(jigu)数据仓库管理物理数据模型数据转换应用开发数据挖掘服务系统体系结构设计元数据管理解决方案集成第十二页,共25页。132.6 数据模型的演变(ynbin)概念数据模型(概念数据模型(CDM Conceptual Data Model CDM Conceptual Data Model)主要实体和它们的关系主要实体和它们的关系 (Major Entities and Their Majo
11、r Entities and Their RelationshipsRelationships)逻辑逻辑(lu j)(lu j)数据模型数据模型 (LDM-Logical Data Model LDM-Logical Data Model)业务模型加(业务模型加(CDM PlusCDM Plus):所有的表及简单的数据(所有的表及简单的数据(All Tables with Sample DataAll Tables with Sample Data)辅助的表及简单的数据(辅助的表及简单的数据(Minor Tables with Sample Data Minor Tables with Sam
12、ple Data)主键与外键的关系(主键与外键的关系(PK&FK Relationships PK&FK Relationships)数据约束(数据约束(Constraints Constraints)属性(属性(Attributes Attributes)扩展逻辑扩展逻辑(lu j)(lu j)数据模型数据模型 (ELDM-Extended Logical Data ELDM-Extended Logical Data Model Model)逻辑逻辑(lu j)(lu j)数据模型加(数据模型加(LDM PlusLDM Plus):存取详细描述(存取详细描述(Access Demograp
13、hicsAccess Demographics)数据详细描述(数据详细描述(Data DemographicsData Demographics)物理数据模型物理数据模型 (PDM-Physical Data Model PDM-Physical Data Model)扩张逻辑扩张逻辑(lu j)(lu j)数据模型(数据模型(ELDM PlusELDM Plus):索引索引 (IndicesIndices)非正则化非正则化 (DenormalizationDenormalization)第十三页,共25页。142.6 非正则(zhn z)化处理(Denormalization)非正则化的两种
14、类型:物理非正则化派生数据(Derived Data)汇总表(Summary Tables)重复的Groups (Repeating Groups)多物理表(Multiple Physical Tables)预连接(Pre-joins)子实体(Sub-entities)逻辑非正则化视图(Views)逻辑星型结构(Logical Star Schemas)物理非正则化对模型的灵活性会有影响逻辑非正则化是一个(y)优选的方法(OLAP实现)第十四页,共25页。152.6 物理(wl)数据模型(PDM)第十五页,共25页。162.7 数据(shj)转换与加载(ETL)主要任务:主要任务:数据源及其特
15、性定义数据源及其特性定义数据析取、转换和加载策略设计数据析取、转换和加载策略设计构建和测试构建和测试(csh)(csh)初始加载的程序和处理初始加载的程序和处理流程流程构建和测试构建和测试(csh)(csh)日常加载的程序和处理日常加载的程序和处理流程流程40%40%的工作量在数据转换与加载上的工作量在数据转换与加载上使用工具:使用工具:SagentSagent或或DatastageDatastage、InformaticInformatic交付项目:交付项目:数据转换加载设计说明书数据转换加载设计说明书数据映射数据映射 (Data MappingData Mapping)说明书)说明书 数据
16、转换加载脚本数据转换加载脚本 (ETL Scripts)ETL Scripts)加载流程控制(加载流程控制(ETL Process Control)ETL Process Control)数据仓库管理(gunl)物理数据模型数据转换应用开发数据挖掘服务系统体系结构设计元数据管理解决方案集成第十六页,共25页。172.7 数据(shj)清洗方法在源系统上进行(jnxng)清洗(数据析取前)在加载服务器上进行(jnxng)清洗(数据析取后、加载前)在数据仓库里进行(jnxng)清洗(数据加载后)源系统(xtng)ETL服务器数据仓库第十七页,共25页。182.7 数据转换(zhunhun)常用手段
17、 析取 Extracting 条件 Conditioning 剔除 Scrubbing 合并(hbng)Merging 浓缩 Enrichment 确认 Validating 加载 Loading 评分 Scoring 关系识别 House holding第十八页,共25页。192.8 前端应用(yngyng)开发主要任务:主要任务:前端应用体系结构设计前端应用体系结构设计OLAPOLAP应用设计应用设计(Summary/Fact(Summary/Fact表及表及CubCub的产生)的产生)前端应用开发(随机查询、预定义报表、前端应用开发(随机查询、预定义报表、OLAP OLAP应用)应用)撰
18、写用户使用手册撰写用户使用手册用户测试用户测试(csh)(csh)验收验收使用工具:使用工具:查询报表工具查询报表工具(Hyperion performance suit)(Hyperion performance suit)OLAPOLAP工具(工具(Essbase)Essbase)基于基于WebWeb的开发工具的开发工具(J2EE)(J2EE)其他开发工具其他开发工具,如如:Portal:Portal交付项目:交付项目:前端应用体系结构设计说明书前端应用体系结构设计说明书应用模块设计说明书应用模块设计说明书 用户使用手册用户使用手册 数据仓库管理(gunl)物理数据模型数据转换应用开发数据
19、挖掘服务系统体系结构设计元数据管理解决方案集成第十九页,共25页。202.10 元数据管理元数据元数据(shj)(Metadata)(shj)(Metadata)是指关于数据是指关于数据(shj)(shj)的数据的数据(shj)(shj),即,即用来描述数据用来描述数据(shj)(shj)的类型、来源、定义、存储位置,使得业务用户的类型、来源、定义、存储位置,使得业务用户可以正确地使用数据可以正确地使用数据(shj)(shj)仓库。仓库。主要任务:主要任务:定义元数据使用功能定义元数据使用功能设计元数据环境逻辑结构设计元数据环境逻辑结构设计元数据环境物理设计元数据环境物理(wl)(wl)结构结
20、构选择合适的元数据管理工具选择合适的元数据管理工具建立元数据仓库(建立元数据仓库(Metadata Repository)Metadata Repository)建立和测试元数据接口建立和测试元数据接口使用工具:使用工具:ETL TOOLSETL TOOLS交付项目:交付项目:元数据管理说明书元数据管理说明书数据仓库管理(gunl)物理数据模型数据转换应用开发数据挖掘服务系统体系结构设计元数据管理解决方案集成第二十页,共25页。212.10 元数据(shj)开发元数据的开发应该包含在数据仓库实施过程(guchng)的每一步骤中,下图是元数据各部分内容与数据仓库开发过程(guchng)的对应关系
21、:第二十一页,共25页。222.11 数据仓库管理(gunl)主要任务:主要任务:设计和开发数据仓库支持体系结构设计和开发数据仓库支持体系结构开发和测试数据仓库日常运作流程开发和测试数据仓库日常运作流程开发和测试性能监视程序开发和测试性能监视程序(chngx)(chngx)开发和测试数据备份与恢复程序开发和测试数据备份与恢复程序(chngx)(chngx)开发和测试安全系统开发和测试安全系统设计和开发操作人员设计和开发操作人员/最终用户培训计划最终用户培训计划建立用户支持和培训材料建立用户支持和培训材料使用工具:使用工具:系统监控工具和管理工具系统监控工具和管理工具交付项目:交付项目:数据仓库
22、管理过程说明书数据仓库管理过程说明书数据备份过程设计说明书数据备份过程设计说明书安全管理模块设计说明书安全管理模块设计说明书用户培训计划及用户使用手册用户培训计划及用户使用手册数据仓库管理(gunl)物理数据模型数据转换应用开发数据挖掘服务系统体系结构设计元数据管理解决方案集成第二十二页,共25页。232.12 解决方案集成(j chn)主要任务:主要任务:建立并执行集成测试计划建立并执行集成测试计划建立并执行数据仓库平台建立并执行数据仓库平台(pngti)(pngti)测试计划测试计划建立并执行系统验收测试计划建立并执行系统验收测试计划移植开发系统到生产系统移植开发系统到生产系统执行用户培训
23、计划执行用户培训计划实施数据仓库管理基础设施实施数据仓库管理基础设施项目实施完成项目实施完成回顾项目状态回顾项目状态交付项目:交付项目:数据转换管理系统测试报告数据转换管理系统测试报告数据访问和信息发布系统测试报数据访问和信息发布系统测试报告告数据仓库平台数据仓库平台(pngti)(pngti)测试报告测试报告数据仓库管理过程测试报告数据仓库管理过程测试报告系统回顾报告系统回顾报告数据仓库管理(gunl)物理数据模型数据转换应用开发数据挖掘服务系统体系结构设计元数据管理解决方案集成第二十三页,共25页。24总结:主要(zhyo)步骤及文档间关系 Business Discovery(Busin
24、ess Discovery(业务探索业务探索)业务需求业务需求(xqi)(xqi)说明书说明书(BRL)(BRL)概念数据模型概念数据模型(CDM)(CDM)物理数据物理数据(shj)(shj)库设计库设计 物理数据物理数据(shj)(shj)模型模型(PDM)(PDM)数据数据(shj)(shj)库描述语言库描述语言(DDL)(DDL)数据数据(shj)(shj)转换加载转换加载(ETL)(ETL)数据数据(shj)(shj)加载设计说明书加载设计说明书 数据数据(shj)(shj)映射映射 (Data Mapping)Data Mapping)转换加载脚本转换加载脚本 (ETL Scrip
25、ts)ETL Scripts)加载流程控制(加载流程控制(ETL Control)ETL Control)前端应用设计前端应用设计 前端应用体系结构前端应用体系结构 前端应用设计说明书前端应用设计说明书 Summary/Fact Summary/Fact 表设计表设计 Summary/Fact Summary/Fact 数据数据(shj)(shj)生成生成 OLAP OLAP设计设计 应用开发应用开发 应用集成应用集成数据仓库管理物理数据模型数据转换应用开发数据挖掘服务系统体系结构设计元数据管理解决方案集成项目具体实施步骤项目前期准备业务探索信息探索逻辑数据模型 Information Discovery(Information Discovery(信息探索信息探索)功能需求列表(FRL)逻辑数据模型逻辑数据模型(LDM)(LDM)逻辑模型设计说明书 源数据分析(SDA)系统体系结构设计系统体系结构设计(SA)(SA)系统命名规范设计 系统安全体系设计(SD)数据仓库管理数据仓库管理元数据管理元数据管理解决方案集成解决方案集成第二十四页,共25页。253、项目(xingm)关键成功因素v 需求明确v 业务用户(yngh)参与v 高层领导支持v 可扩展的软硬件平台v 成功的行业经验第二十五页,共25页。