《【企业管理课程】-数据仓库概念、设计及应用.ppt》由会员分享,可在线阅读,更多相关《【企业管理课程】-数据仓库概念、设计及应用.ppt(30页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、数据仓库数据仓库概念、设计及应用概念、设计及应用提纲提纲1.为什么要建立数据仓库为什么要建立数据仓库2.数据仓库的概念及特性数据仓库的概念及特性3.数据仓库的结构数据仓库的结构4.数据仓库的设计数据仓库的设计5.数据仓库的开发过程数据仓库的开发过程6.数据仓库的典型应用数据仓库的典型应用事务处理环境不适宜事务处理环境不适宜DSS应用的原因应用的原因 vv事务处理和分析处理的性能特性不同事务处理和分析处理的性能特性不同事务处理和分析处理的性能特性不同事务处理和分析处理的性能特性不同 n n操作型处理操作型处理操作型处理操作型处理对数据的存取操作频率高而每次操作处理的对数据的存取操作频率高而每次操
2、作处理的对数据的存取操作频率高而每次操作处理的对数据的存取操作频率高而每次操作处理的时间短;时间短;时间短;时间短;n n在分析处理环境中,某个在分析处理环境中,某个在分析处理环境中,某个在分析处理环境中,某个DSSDSS应用程序可能需要连续几应用程序可能需要连续几应用程序可能需要连续几应用程序可能需要连续几个小时,从而消耗大量的系统资源。个小时,从而消耗大量的系统资源。个小时,从而消耗大量的系统资源。个小时,从而消耗大量的系统资源。vv数据集成问题数据集成问题数据集成问题数据集成问题vv数据动态集成问题数据动态集成问题数据动态集成问题数据动态集成问题vv历史数据问题历史数据问题历史数据问题历
3、史数据问题 vv数据的综合问题数据的综合问题数据的综合问题数据的综合问题 抽取程序抽取程序vv用抽取程序能将数据从高性能联机事务处理方式中转移出用抽取程序能将数据从高性能联机事务处理方式中转移出用抽取程序能将数据从高性能联机事务处理方式中转移出用抽取程序能将数据从高性能联机事务处理方式中转移出来,在需要总体分析数据时就与联机事务处理性能不发生来,在需要总体分析数据时就与联机事务处理性能不发生来,在需要总体分析数据时就与联机事务处理性能不发生来,在需要总体分析数据时就与联机事务处理性能不发生冲突。冲突。冲突。冲突。vv用抽取程序能将数据从联机事务处理范围内移出时,数据用抽取程序能将数据从联机事务
4、处理范围内移出时,数据用抽取程序能将数据从联机事务处理范围内移出时,数据用抽取程序能将数据从联机事务处理范围内移出时,数据的控制方式就发生了转变。的控制方式就发生了转变。的控制方式就发生了转变。的控制方式就发生了转变。蜘蛛网问题蜘蛛网问题体系结构设计环境的层次体系结构设计环境的层次操作层操作层操作层操作层原子原子原子原子/数数数数据仓库层据仓库层据仓库层据仓库层部门层部门层部门层部门层个体层个体层个体层个体层数据仓库的概念数据仓库的概念 数据仓库的特性数据仓库的特性 数据仓库的结构数据仓库的结构早期细节级早期细节级早期细节级早期细节级当前细节级当前细节级当前细节级当前细节级轻度综合级轻度综合级
5、轻度综合级轻度综合级数据集市数据集市数据集市数据集市高度综合级高度综合级高度综合级高度综合级元元元元数数数数据据据据操作型转换操作型转换操作型转换操作型转换 数据仓库设计中的几个重要概念数据仓库设计中的几个重要概念 典型的元数据包括:典型的元数据包括:数据仓库设计中的几个重要概念数据仓库设计中的几个重要概念(续)续)企业数据模型到数据仓库数据模型的转换企业数据模型到数据仓库数据模型的转换数据模型的规范化数据模型的规范化/反规范化反规范化数据仓库体系结构数据仓库体系结构OLTP数据源数据源数据仓库数据仓库数据集市数据集市?数据采集及整合数据采集及整合数据的映射规则、模型数据的映射规则、模型。(元
6、数据管理)(元数据管理)数据仓库项目流程管理及系统性能管理和监控数据仓库项目流程管理及系统性能管理和监控?数据展现及决策数据展现及决策生产财务结算外部航线分析总量分析市场分析InfoPump数据分析、DM终端用户终端用户从操作型的现存系统到数据仓库中数据从操作型的现存系统到数据仓库中数据转换工作的难点转换工作的难点概念概念:数据周期、简要记录数据周期、简要记录数据仓库的建模数据仓库的建模Vendor dataVendor dataVendor datavendor_id供应商供应商cust_id客户客户order_id发货发货Order dataOrder dataorder_id订单订单Cu
7、st dataCust dataCust dataNonkey dataOrder dataOrder dataOrder data产品产品Product dataProduct dataProduct dataProduct idVendor idNonkey datacust idNonkey dataorder idNonkey dataproduct id数据建模的十条戒律数据建模的十条戒律必须回答紧迫的问题;必须回答紧迫的问题;必须回答紧迫的问题;必须回答紧迫的问题;必须有正确的事实表;必须有正确的事实表;必须有正确的事实表;必须有正确的事实表;将有正确的维表,描述必须按最终用户的业
8、务术语将有正确的维表,描述必须按最终用户的业务术语将有正确的维表,描述必须按最终用户的业务术语将有正确的维表,描述必须按最终用户的业务术语表达;表达;表达;表达;必须理解数据仓库所影响的公司过程或影响数据仓必须理解数据仓库所影响的公司过程或影响数据仓必须理解数据仓库所影响的公司过程或影响数据仓必须理解数据仓库所影响的公司过程或影响数据仓库的公司过程;库的公司过程;库的公司过程;库的公司过程;对于事实表,应该有正确的对于事实表,应该有正确的对于事实表,应该有正确的对于事实表,应该有正确的“粒度粒度粒度粒度”;根据需要存储正确长度的公司历史数据;根据需要存储正确长度的公司历史数据;根据需要存储正确
9、长度的公司历史数据;根据需要存储正确长度的公司历史数据;以一种对于公司有意义的方式来集成所有必要的数以一种对于公司有意义的方式来集成所有必要的数以一种对于公司有意义的方式来集成所有必要的数以一种对于公司有意义的方式来集成所有必要的数据;据;据;据;创建必要的总结表;创建必要的总结表;创建必要的总结表;创建必要的总结表;创建必要的索引;创建必要的索引;创建必要的索引;创建必要的索引;能够加载数据仓库数据库并使它以一种适宜的方式能够加载数据仓库数据库并使它以一种适宜的方式能够加载数据仓库数据库并使它以一种适宜的方式能够加载数据仓库数据库并使它以一种适宜的方式可用。可用。可用。可用。数据集市数据集市
10、外部数据外部数据用自顶向下的方法构建数据仓库用自顶向下的方法构建数据仓库数据集市数据集市建造企业数据仓库建造企业数据仓库H建设中心数据模型H一次性的完成数据的重构工作H最小化数据冗余度和不一致性H存储详细的历史数据从企业数据仓库中建造数据集市从企业数据仓库中建造数据集市H得到大部分的集成数据H直接依赖于数据仓库的可用性操作数据操作数据问题投资效益的时间投资效益的时间?H建设中心数据模型的必要性和可能性?初始费用初始费用?企业数据仓库企业数据仓库用自底向上的方法构建数据仓库用自底向上的方法构建数据仓库数据集市数据集市建立部门数据集市建立部门数据集市H限制在一个主题区域H快速投资收益 H区域自治
11、设计的可伸缩性强H对相关部门的应用容易复制 H对每个数据集市需要数据重构H存在一定的冗余及不一直性逐步扩展到企业数据仓库逐步扩展到企业数据仓库(EDW)H把建造EDW作为一个长期的目标存在的问题:数据集市的数据都是可用的吗数据集市的数据都是可用的吗?能生成数据模型吗能生成数据模型吗?如何解决不一致性如何解决不一致性?外部数据外部数据操作数据操作数据(全局全局)&操作数据操作数据(局部局部)操作数据操作数据(局部局部)数据集市数据集市企业数据仓库企业数据仓库数据仓库的开发过程数据仓库的开发过程数据模型的内容数据模型的内容表达数据模型的最好数据表达数据模型的最好数据将数据模型变为数据仓库要做的主要工作将数据模型变为数据仓库要做的主要工作在接口中需完成的工作在接口中需完成的工作数据仓库开发成功的关键数据仓库开发成功的关键数据仓库的应用数据仓库的应用Have Any Questions?