《大数据中心建设思路培训讲学.ppt》由会员分享,可在线阅读,更多相关《大数据中心建设思路培训讲学.ppt(82页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、大数据中心建设思路国网数据中心概念数据中心物理架构业务系系统数据数据库服服务器器心跳心跳线DSO/DM磁带库光纤交换机光纤交换机磁盘柜存存储WEB备份服务器BI 应用服用服务器群器群ETL/Monitor/AnalysisETLAnalysisHPODSDW/DMBI应用服务器可由多个服务器组成应用集群6数据中心建设的终极目标企业统一数据模型数据边界顶层信息模型实现最终目标的困难网省网省电力数据力数据应用所面用所面临的挑的挑战业务挑挑战现有分析系统仅提供简单的报表能力,功能单薄领导层无法从企业全局角度出发对企业各个业务条线进行跨业务、多角度、多层次的综合分析业务分析系统多集中于各自专业领域,而
2、跨业务专题的分析应用能力尚不具备存在相同数据多头上报并且上报数据不一致的问题缺乏对现有数据的高级分析应用,没有合理地发挥和利用网省电力业务数据资产的价值技技术挑挑战各个业务系统相互独立,业务人员难以进行跨系统业务分析现有分析型系统与相应生产型系统耦合性较强,受到生产型系统影响较大,缺乏对全业务分析的支持数据不一致问题较严重,对于相同业务数据存在多个不同版本各业务系统自行管理数据,业务数据的含义在企业的各个部门内存在不一致的解释各类业务系统内数据质量较低业务因素因素数据分析类型划分不够明确缺少统一的报表与指标体系规范缺乏明确的数据认责技技术因素因素缺乏规范的数据架构缺乏明确的数据定义数据分布不合
3、理数据模型不一致数据管理不规范缺乏企业级整合的数据缺乏有力的系统实施和使用管控机制11数据中心的建设策略短期见效、应用驱动展现全局指标数据,早出成果,短期见效,以应用促建设非源头数据直接导入,健全全局类指标数据转移部分业务系统查询功能切断统计途径推动数据中心应用数据中心建设最终是为解决业务部门专业分析能力而服务,在这个逐步推进、不断完善成熟的过程中,应着重解决影响应用实用性不强的如下几点:q好的经验、方法和操作流程是关键,促进信任关系的建立,解决互不信任的局面。q在一套有效的方法的指导下,同时遵照一个好的流程,就容易得到领导支持,得到业务人员的有效参与和技术人员的有力配合 q解决长周期项目中期
4、没有任何产出的现状q消除领导及业务人员对数据中心建设疑虑q建设期间、获取业务人员对实施过程中的认可和支持,从而不断增强他们对项目的信心及应用实用性的肯定q解决企业数据“进口”与“出口”数据统一q切断网省业务人员获取统计数据的其他来源,统一定义从数据中心获取q切断业务应用向总部交换数据的其他途径123业务部门主导过程中不断出成果切断原有数据统计、汇报方式数据中心的建设方式1、自顶向下(追溯法分析应用法)既先分析报表中指标数据,再根据指标的构成进行追溯分析,直至建设粒度到最小的、不可再分的业务细节数据;这种方式有利于梳理统计类指标,分析企业中各统计指标的口径。侧重纵向数据关联。2、自下而上(数据整
5、合法)这种建设思路是先建立企业的概念模型,然后利用数 据仓库和企业建模标准等思想进行全面的数据模型设计、物理模型设计。侧重横向分析和标准建设。3、折中建设建设方法对比方法方法1.1.先数据整合、先数据整合、再构建分析应用再构建分析应用方法方法2.2.先构建分析先构建分析应用、再进行数据整应用、再进行数据整合(或者不进行全局合(或者不进行全局整合)整合)方法方法3.3.边构建分析边构建分析应用、边进行数据整应用、边进行数据整合合优势挑战适用于业务较为简单或业务需求明确数据基础较好有成熟建模经验业务条线复杂、数据基础水平不一、应用需求层次不同要具备成熟的数据标准和数据模型数据整合投入较大,短期内与
6、分析应用收益不能相符可实行有效的数据质量管理可快速进行分析应用的扩展分析应用快速见效数据质量无法保障只能满足部门级使用分析应用快速见效逐步深化的建设方法,兼顾效率和可扩展性调动业务驱动力工作方法的统一一致建设团队的有效分工、协作建议采用方法3进行数据中心数据整合的建设分析应用演进专业分析建设方法业务驱动力梳理分工协作模式确认建设任务分工实施验证q业务部门专业分析建设驱动力调研q按专业分析建设指导思路,深化业务部门专业分析需求调研q按数据耦合度分工建设q可按源系统接入管理、数据整合管理、分析应用建设管理的方式分工建设q组建专业分析应用建设团队,同数据中心运维团队建立分工协作机制,有效推进数据整合
7、工作q按试点、推广、验证的数据中心建设流程迭代完成数据中心逐条线建设策略的部署17选择合适专业分析应用满足业务部门需要量身定制的业务需求生产分析举例n典型日负荷曲线增长趋势分析n峰谷差分析n责任频率合格率分析n电压合格率分析n变压器负载情况分析安全生产分析举例n人身事故分析n设备事故分析n电网事故分析n电力设施保护分析n设备障碍情况分析避免综合统计查询建设涵盖面广、集中展现指标集合的现象解决数据粒度粗放,业务主题分析不够深入的问题按专业分析条线逐步完成数据整合,有利推动一体化平台数据中心的建立专业分析深入性强实施路线成熟度高分析深入性强,需求定义严谨专业分析内部耦合性强设计结构要求严谨专业分析
8、18数据中心共享演进p继续完善数据交换平台,提升交换效率、性能,足以支持远程大数据传输的实现。p在服务质量保证方面,关注数据交换场所的安全性、可靠性。p构建数据交换接口区数据接口规范,随着数据仓库建设的进度而扩展接口区数据规范。综合数据交换区域营销数据交换区域生产数据交换区域ERP数据交换区域共享数据区域设计总部深化数据获取日报数据总部深化数据获取日报数据细化数据深度细化数据深度提升数据共享提升数据共享性能性能完善优化完善特定业务需求的级联要求基本成型完成基于细粒度历史数据的专业分析数据起步速成完成基于粒度粗放数据的综合指标查询数据 19展示展示层数据分析数据分析应用用层数据集市数据集市层八大
9、八大业务应用数据和其它外部数据用数据和其它外部数据安全生产财务绩效设备生产企企业数据数据仓库(EDW)数据数据仓库层数据的抽取数据的抽取/清洗清洗/整合整合数据源数据源层安全生产分析营销分析财务绩效分析电网运行分析设备生产分析人力资源分析项目分析物资分析综合统计分析电网运行电力市场分析人力资源项目电力市场营销物资综合统计网省网省电力公司数据力公司数据仓库逻辑架构架构数据应用分析通过企业级数据仓库及数据集市提供数据支持,并通过前端展示层将分析的结果用合适直观的方法展现给最终用户 21数据仓库能力蓝图数据数据仓库集中整合集中整合信息描述信息描述数据移数据移动分析展分析展现质量保障量保障高高级应用用
10、提供多维分析能力,使得用户能够把一个实体的多项重要属性定义为多个维度进行深入分析,并能对不同维度值的数据进行比较;同时,还需具备数据挖掘能力,帮助业务分析人员在现有数据中识别数据的模式,针对整个企业的状况和未来发展作出较完整、合理、准确的分析和预测,从复杂难懂的数据中发掘出指引企业发展需要的路径提供标准的报表和图表功能来帮助不同管理层人员做出正确决策;针对具体分析应用建立数据集市为前端提供高效的数据查询和分析服务为了方便整个数据仓库保存信息的管理,需要具备强大的元数据管理功能,以实现各类技术术语与流程在企业内部的统一定义通过数据仓库,使得数据按照业务主题进行存储,完成对分散数据的整合工作,形成
11、企业内部“唯一事实”提供较强的数据抽取、转换与加载能力:能够高效地将前端业务分析所需要的各类数据移动到数据仓库内,根据预先制定的业务规则对数据进行处理转换使其符合目标数据格式,并根据前端展现需求提供高性能数据加载机制数据仓库应该具备完善的数据质量管理机制,确保企业内部数据的一致性与准确性,提升数据仓库分析结果的可信性22数据数据应用的用的业务目目标根据对国际先进电力企业的研究,数据应用工作可以通过提高四项能力(即电网安全运营管理、电力营销及服务、财务绩效分析和资源计划及决策)来促进电网的业务发展。数数数数据据据据应应用用用用提高电力力营销管理及服管理及服务能力通过对用电量、电费、电价的分析,提
12、高电量的需求预测能力、价格制定能力全面了解用电户的电力消费和缴费情况,帮助制定相关的用电政策和服务措施.分析营销手段及效果,提升营销策略的有效性提高电网安全运网安全运营管理管理能力通过对设备和电网的运行状况、检修、缺陷、事故的及时准确掌握,提高设备和电网的监控管理能力,科学管理电网设备资源;通过对安全人身伤亡事故的分析,提高事故管理和防范能力提高财务绩效分析效分析能力反映企业单位的财务成果;指导企业单位降低成本和费用,增加收入;充分利用资金,创造好的经济水平员工绩效分析,从组织和个人两个层面为绩效管理提供支撑依据。提高资源源计划及决划及决策策能力完善报表管理,为领导及时提供全面的关键业务信息。
13、通过国网业务运行状态的分析和监控,提高信息预测能力,为领导的科学决策提供保证,电网用户前台业务人员后台管理人员决策领导数据分析应用的业务目标 通过构建四项能力来促进网省电力业务的发展23数据分析应用基本涵盖了网省电力所有业务数据范围安全生安全生产分析分析设备生生产分分析析财务绩效分析效分析电网运行分析网运行分析电力市力市场分析分析营销分析分析人力人力资源分析源分析物物资管理分析管理分析项目建目建设分析分析业务监控电量电费电价分析销售分析市场开发分析需求预测营销分析线损信息分析客户服务分析机构构成分析定员定岗分析人员组成分析工资分析教育培训分析绩效考核报表与信息查询销售分析物资收入经济分析物资消
14、耗经济分析物资库存经济分析分析预算超时限分析市场信息分析建设情况分析投资情况分析投产效果分析分析与国网公司生产建设过程中发生的各类人身伤亡事故相关的数据统计 设备构成分析设备动态信息分析设备检修分析设备缺陷分析设备试验分析财务指标资金分析成本分析利润和收益分析负荷分析电压质量分析电量平衡分析网损分析无功补偿分析电网保护设备分析交易量分析交易费用分析电力价格分析市场需求预测综合分析合分析计划划统计生产经营指标分析用电营业指标分析电网运行产品成本、销售收入和利润电网建设安全指标24公司公司领导财务人人员生生产人人员计划人划人员调度人度人员人人资部部门人人员项目管理人目管理人员科信管理人科信管理人员
15、物物资管理人管理人员营销人人员电力交易人力交易人员网省电力各层次用户通过数据分析应用而受益25保保证设备综合信息的完合信息的完整性和整性和历史性史性从横向确保完整性:设备运行的情况设备消耗的水、煤、气记录设备运行的可靠性记录记录设备的测试信息。从纵向确保历史性:当期上期历史同期历年情况。设备管理管理监控人控人员/后台管理人后台管理人员数据整合支持数据整合支持统一一设备视图设备台帐信息 设备检修设备测试设备故障设备运行设备消耗设备事故设备环境设备可靠性其他信息(ODS)数据仓库ODS保障数据的时实可访问性数据仓库保障数据的历史性统一信息视图提供了快速访问主题全面信息的能力某某电力力设备26数据数
16、据仓库建建设策略比策略比较l重复的ETL发开和数据整合,人力资源浪费l重复的ETL工具,前端分析工具,数据仓库平台软件的购买。l各自的数据模型设计,集市之与集市之间潜在的新一轮数据整合需求。l无丰富的企业全面业务数据支撑,无法提供跨系统的业务分析能力l集市各自的指标定义,在企业层面,容易出现不一致l不符合一体化平台建设要求l形成企业范围内统一信息视图l建设统一、可重用的ETL流程lETL工具,前端分析工具、数据仓库平台单次采购和开发,有效降低TCOl丰富的企业全面业务数据支撑,领导以及业务人员能够得到更加丰富的数据l各业务部门可根据自身需求在统一数据仓库平台上建设更深层次的高级数据分析应用l建
17、设元数据管理机制实现企业内术语理解一致l建设统一的数据管理机制,提升数据质量推荐推荐实现方法方法I业务部部门单独建立各自数据集市,独建立各自数据集市,无企无企业层面的面的统一的一的规化和化和协调实现方法方法II信息部信息部门牵头统一建一建设企企业数据数据仓库VS27企企业级概念概念数据模型数据模型企企业级逻辑数据模型数据模型企企业主主题主主题逻辑数数据模型据模型物理数据模物理数据模型型指指导细化化概念数据模型概念数据模型逻辑数据模型数据模型物理数据模型物理数据模型转换当前已有成果当前已有成果在相当长的时间内,在相当长的时间内,还需要做的事情还需要做的事情数据模型建立过程29数据集市数据集市层八
18、大八大业务应用数据和其它外部数据用数据和其它外部数据数据数据仓库层数据源数据源层直接满足上层数据分析应用要求查询的高效性和有针对性高度聚合,一般无明细从技术而言是星型模式数据分析模型数据分析模型主题1主题2主题n基于主题域侧重于对企业范围内数据进行整合明细数据与聚合数据共享从技术而言是3NF模式数据数据仓库模型模型数据模型在数据数据模型在数据仓库架构中所架构中所处的位置的位置30企业级概念数据建模目的主主题主主题主主题主主题主主题主主题主主题主主题主主题业务数据数据业务数据数据业务数据数据业务数据数据业务数据数据业务数据数据业务数据数据业务数据数据业务数据数据数据分数据分类企业级概念数据建模的
19、目标在于识别网省电力业务主要数据主题并根据各个数据主题间的逻辑关系划分其所属数据主数据主题域域。数据主题域集中反映了某方面的业务内容,通常是同类或关联关系较为紧密的数据主题的集合(如,设备主题包括了设备台帐、设备运行相关事件等多个数据主题)。数据主数据主题是任何可以区分的人、地点、事情、事件或概念,信息围绕它来保存。属性是实体的特性或数据字段。数据主题域是数据仓库主题建模的基础,通过细化数据主题域即可建立统一的数据仓库模型。统一数据仓库模型是网省电力公司数据仓库进行数据整合和集成的重要基础。31企业级概念数据建模方法l数据主数据主题梳理梳理 通过仔细分析网省电力公司各类业务系统详细说明,IT咨
20、询组从中梳理出网省电力公司业务所产生和需要的主要数据并形成数据主题清单,这些数据主要包括主数据和事物数据两部分:主数据是指客户、供应商、设备台帐等,而事务数据是指网省电力具体业务运营所产生的各种事务型数据,例如设备检测数据、调度交易数据等。l数据主数据主题域域设计 根据分析整理得到的数据主题清单,并结合这些数据的特点和网省电力具体业务关注点即可归纳抽像出数据主题域。主题域集中反映了主题相关的所有业务内容,通常是同类或关联关系较为紧密的数据主题集合业务系系统详细说明明数据梳理数据主数据主题清清单归纳整理数据主数据主题域域32数据主题域划分安全安全客客户产品品设备电网网财务资产物物资项目目人人员与
21、与组织综合管理合管理事故信息事故损失安全记录客户基本信息客户信用客户电价客户表计信息客户变更客户消费电能客户帐单客户负荷客户缴费客户产品订购客户服务产品基本信息产品价格产品质量保障服务流程定义设备台帐设备运行设备检修设备测试设备消耗设备环境设备故障设备可靠性电力成本电力价格电网结构电力调度电量交易电力市场预测科目银行凭证会计帐簿财务报表资产卡片资产形成资产租赁资产借用资产变更资产调拨资产报废清产核资资产折旧投融资资产报表物资编码物资分类物资供应库存信息出入库管理项目基本信息项目计划信息项目设计信息项目管理信息设备材料信息竣工决算信息投产成果信息需求信息费用信息合同信息招投标信息业绩信息职位信息
22、调动信息奖惩信息培训信息社保缴纳劳保领用外事信息人员基本信息薪酬福利信息社会保险信息劳动保障信息组织机构信息法律国际任务同业对标审计信息纪检监察计划统计服务质量考核服务绩效分析33数据主题域详细解释安全安全安全主题域用于描述公司运营过程中的人身事故、电网事故和安全损失等信息客客户客户主题域主要由客户的基本信息、计费缴费信息、客户服务信息等组成产品品产品主题描述国网公司提供的电能、热能与国网公司所提供服务的描述与价格信息以及与服务质量、服务效果相关的各类记录设备设备主数据用于描述企业发电、输电、配电、供电四大类在网运行设备资源、运行和调度信息、测试、破坏和环境等信息电网网电网主题域包含了市场的电
23、力价格、预测相关信息,网间、电厂电网的交易信息,以及电力调度中设备产生的相关数据财务财务主题域描述了财务的核算、预算、固定资产、资金数据以及会计账目等相关数据资产资产主题域描述了与国网公司各类有形/无形、金融/非金融资产相关的各类信息物物资物资主题域描述了与国网公司的物资与物资管理相关的各类信息项目目项目主数据表达了基建项目、跨区电网项目、投资项目、大修项目、技改项目、科技项目、用户项目和信息化项目的全生命周期的信息人人员与与组织人员与组织主题域用于描述公司业务活动中人和组织结构信息综合管理合管理综合管理主题域描述同业对标、计划统计、审计、法律、纪检、国际任务信息34概念逻辑模型35主题域概念
24、模型产品品客客户安全安全设备36主题域概念模型(续1)物物资电网网资产财务37主题域概念模型(续2)综合管理合管理项目目人人员与与组织38数据建模一步工作:在概念模型基础上,进行国网公司企业级逻辑数据模型的建设安全安全客客户企企业级逻辑数据模型包含数据模型包含近千个近千个业务实体及其复体及其复杂的关系的关系巨大的挑巨大的挑战!企企业级概念数据模型概念数据模型细化化企企业级逻辑数据模型数据模型*企企业级逻辑数据模型的建数据模型的建设应该以数据以数据仓库建建设为线索,是数据索,是数据仓库建建设的重要工作之一的重要工作之一示例39国网数据中心整体建设目标体系数数据据应用用安全生安全生产分析分析财务绩
25、效分析效分析营销分析分析电网运行分析网运行分析设备生生产分析分析人力人力资源分析源分析计划划统计物物资管理分析管理分析电力市力市场分析分析项目建目建设分析分析41综合决策合决策 综合国网合国网业务指指标 建立数学模型,建立数学模型,综合合预测 完善关完善关键绩效指效指标考核等考核等应用用 制定策略,指制定策略,指导业务实践践 综合决策合决策 套装套装软件内件内紧密耦合的密耦合的专业分析分析 通用平台通用平台专业分析分析 跨平台的跨平台的专业分析分析 .专业分析分析绩效效预测指指标挖掘挖掘人力人力生生产财务 套装套装软件件业务基基础数据整合数据整合 在套装在套装软件内部完成件内部完成 非套装非套
26、装软件件业务在通用平台在通用平台 整合完成整合完成 交交换数据数据基基础数据整合数据整合层次:决策次:决策层内容内容:指指标衡量衡量层次:管理次:管理层内容内容:专业分析分析综合分析合分析物物质项目目设备计划划国国际合作合作营销招投招投标 营销分析分析 生生产分析分析 人力人力分析分析财务分析分析物物质分析分析项目目分析分析设备分析分析计划划分析分析数据中心整体建数据中心整体建设目目标体系在体系在应用架构上的分解用架构上的分解42基于通用平台实现套装软件营销系统生产系统 EDW-ODS企企业级数据数据仓库通用平台前端通用平台前端集集市市集集市市集集市市集集市市前端集市层数据仓库层ODS源系统l
27、DW中应用国网统一的数据模型和数据标准;l整合后的数据通过开放平台前端进行分析和展现;风险可扩展性较好,适应未来应用需求的增长有利于企业级数据模型的建立有利于系统间共享信息的统一信息视图建立43数据中心数据架构44主要数据访问功能名称名称功能功能描述描述报表实现预定义和用户自定义报表功能通过报表工具实现预定义报表的自动生成和分发,并能够灵活的实现用户自定义报表的功能。即席查询进行准实时的业务查询通常即席查询的功能会涉及准实时的业务信息,可以由ODS区提供此类应用,通过即席查询工具,不需要非常专业的SQL知识即可完成业务信息的即席查看。联机分析利用OLAP分析手段实现多维度的交叉分析利用OLAP
28、分析工具,配合设计良好的OLAP数据模型,可以完成业务人员对业务的分析需求。联机分析的手段包括各种图形和表格的表现,以及在其上进行的多维度的交叉分析,帮助用户快速定位和解决问题。知识发现利用数据挖掘等知识发现技术实现特定的分析专题用户获取有用信息的能力体现了数据仓库系统的价值,通过数据挖掘等高级统计分析技术,企业能够将数据源中有价值的信息(知识)识别出来并建立模型,同时通过自动化或半自动化的工具进行分析。知识发现应用根据专题的不同可采用自顶向下或自底向上的方法,分别适应假设验证和知识发现型的应用。46数据访问类型、数据访问复杂度和用户层次三者间的关系复 杂 分析数据数据访问复复杂度度简 单 分
29、析初 级 用户有经验的用户报表表数据分析数据分析查询知知识发现47数据访问方式有限制的交互有限制的交互灵活的交互灵活的交互客客户端通端通过浏览器器访问数据数据 静静态发布布灵活交互架构是能够提供最丰富功能的最新架构。除了与有限制交互相似的功能外,灵活交互架构能够生成包含嵌入式、可供交互、可执行内容的报表。这些可交互内容允许用户体验到接近于客户端/服务器模式工具开发的图形界面使用感觉有限制的交互架构能够让用户访问实时数据。当用户点击链接来获取报表的时候,系统允许用户在一系列参数中选择自己需要的条件。这些HTML页面(可能是静态形式,也可能是互动形式)将被返回给Web服务器并展现给最终用户静态发布
30、是最直观的数据访问架构形式,用户可以通过点击相关链接得到预先生成的报表。这些报表以HTML文件格式存放在Web服务器内。静态发布的执行架构仅由Web服务器和浏览器两部分组成。报表通常是通过批量处理执行产生的 数据访问的实现方式是选择和评价数据访问工具的重要参考依据,目前市场上主流的数据访问实现方式分为两种:客户端-分析服务-数据存储客户端为IE流览器的数据访问 第二种数据第二种数据访问方式因方式因为更容易部署和更少的更容易部署和更少的维护成本,被广泛的使用和形成行成本,被广泛的使用和形成行业标准准48网省数据网省数据仓库的演的演进方法是以数据方法是以数据仓库分析能力和数据整合能力的提高分析能力
31、和数据整合能力的提高为主主线索索,提升数据管控能力提升数据管控能力,改改进数据数据质量量Quick WinQuick Win(速(速(速(速赢赢)数据数据数据数据仓库仓库建立及完善建立及完善建立及完善建立及完善 数据数据数据数据仓库优仓库优化化化化领导决策能力的提高决策能力的提高数据数据质量的改量的改进数据管理能力的提升数据管理能力的提升建立领导查询系统挑选重要的主题进行数据仓库建设提供联机分析及综合报表数据仓库基本建成提供更全面的数据分析以及数据展现可以对数据进行更深层次的挖掘网省数据中心建网省数据中心建设演演进方法方法50国网数据仓库的总体实施策略是以降低风险为原则,通过试点建设积累经验,
32、验证方法,从而形成国网成熟的统一的数据模型标准,数据管控方法和流程,数据仓库体系架构。然后再大面积推广。这样可以保证整个国网数据中心的建设在控、有序。推广网省试点网省数据模型规划,提供基于业务数据主题的高层数据逻辑模型和细节数据物理模型业务数据标准和代码指标准确的建立设计数据仓库技术架构制定数据标准管理及维护流程制定数据质量管理策略和方法数据按其敏感性、重要性建立一套完整的数据安全分级标准试点的建点的建设宣宣贯推广推广经验验证执行督行督导典型典型经验数据模型标准数据仓库技术架构数据管理标准业务数据标准代码指标标准采用采用试点先行,典型点先行,典型经验指指导的策略的策略实行全国网范行全国网范围内
33、的数据内的数据仓库建建设51数据仓库开发的人员和组织52数据仓库开发的阶段、任务和流程计划划分析分析设计开开发测试部署部署项目管理目管理培培训及运行支持及运行支持复复查期望目期望目标定义方案蓝图评估现状能力定义交付策略评估风险定定义ETL功能、技功能、技术整合整合设计开发执行运行环境制定ETL、BI产品测试计划制定UAT计划开发BI前台展现组件安装开发执行运行环境部署ETL、BI组件测试计划完成产品测试完成UAT测试评估部署就绪条件完成数据转换发布应用程序完成操作就绪测试完成性能测试ETL高高层需求确需求确认TTTTTTETL开发流程定义开发执行运行环境需求定义报表详细规范建立概念数据模型定义
34、终端用户访问技术需求定义数据分析需求性能测试计划建立逻辑数据模型建立物理数据模型完成组件测试在整个数据仓库开发过程中,非常关键的任务。需要设入较多的资源53计划阶段计划划阶段段复复查期望目期望目标评估估现状能力状能力定定义方案方案蓝图定定义交付策略交付策略回回顾愿景及愿景及业务目目标定定义方案方案蓝图确确认目目标业务流程流程定定义交付策略交付策略TTTT评定当前定当前业务流程流程评定当前的定当前的 能力、能力、性能、性能、风险 评定当前技定当前技术架构架构评定当前定当前应用程序用程序评定当前定当前组织架构架构评定元数据及数据管控定元数据及数据管控评定当前支撑能力定当前支撑能力应用解决方案用解决
35、方案 技技术解决方案解决方案 业务流程流程变更更解决方案解决方案 运运维解决方案解决方案 定定义开开发策略策略定定义试点策略点策略定定义测试策略策略定定义部署策略部署策略定定义元数据管理元数据管理定定义数据管控策略数据管控策略54分析阶段分析分析阶段段复复查期望目期望目标定定义数据分析需求数据分析需求定定义ETL高高层需求需求TT建立概念数据模型建立概念数据模型定定义开开发、执行、运行行、运行环境的具体需求境的具体需求定定义用用户对数据数据访问的的技技术需求需求制定制定UAT测试计划划制定制定产品品测试计划划制定性能制定性能测试计划划评估估风险55设计阶段设计阶段段定定义ETL功能技功能技术整
36、合整合方案高方案高层需求需求定定义报表表详细规范范TT建立建立逻辑数据模型数据模型制定技制定技术架构及架构及组装装测试计划划设计开开发、执行、运行行、运行环境的准境的准备56开发阶段开开发阶段段ETL开开发流程流程BI前台前台组件开件开发TT建立物理数据模型建立物理数据模型ETL、报表表组件件测试计划划开开发、执行、运行行、运行环境境的准的准备57测试阶段测试阶段段组件件测试产品品测试TT性能性能测试UAT测试确确认组件件测试周期周期编写写组件件测试脚本脚本发布布组件件测试环境境 更新更新测试源数据源数据 执行行组件件测试,并将,并将测试通通报错误及及时修复修复确确认产品品测试周期周期编写写产
37、品品测试脚本脚本发布布产品品测试环境境 执行行产品品测试,并将,并将测试通通报错误及及时修复修复 确确认性能性能测试周期周期编写性能写性能测试脚本脚本发布性能布性能测试环境境 执行性能行性能测试,并将,并将测试通通报错误及及时修复修复 58部署阶段部署部署阶段段评估部署就估部署就绪条件条件 完成数据完成数据转换TT完成部署就完成部署就绪测试发布布应用用评估估应用程序是否就用程序是否就绪评估技估技术架构及基架构及基础架构是否就架构是否就绪 评估部署站点是否部署就估部署站点是否部署就绪 评估国家估国家电网最网最终用用户人人员是否就是否就绪并已培并已培训完成完成 制定偶制定偶发性事件性事件处理机制理
38、机制 列出部署就列出部署就绪每一每一阶段段检查点点 准准备数据数据转换就就绪动作作准准备转换所需正式数据;清洗数据;所需正式数据;清洗数据;创建数据建数据备份份执行数据行数据转换动作作验证转换后的数据后的数据执行部署行部署测试验证操作操作结果果错误修复;管理及服修复;管理及服务支持能力就支持能力就绪确确认操作就操作就绪验证完成完成通知部署、开通知部署、开发及上及上线实施施团队59FI业务管理模块业务管理模块财务ERP业务管理模块总共有7个分析主题;应用到的分析查询共有75个;BW分析模型8个;用到的源系统分为2类:ECC P800和外部平面文件;数据源总共有11个:财务管理ERP高级分析应用E
39、RP业务运行指标杜邦财务分析体系地市公司对标指标总账应收应付固定资产贷款业务量统计凭证错误率分析预制凭证完成情况财务开放记账期间查看包含了13份报表,25个分析查询,2个数据源。杜邦财务分析体系详细地为用户或决策者提供了陕西省电力公司本部、物资公司、信通公司及各地市公司的所有财务状况数据信息的综合性分析平台,用户通过它就可以对各公司的月度财务状况及年度财务总结都有一个全面的掌握.杜邦杜邦财务分析体系分析体系 模型模型结构构图设备维护成本分析电网发展指标资产状况指标分析财务分析数据质量监控 数据质量监控系统由数据监控看板、数据修正、数据质量分析及数据评测报告等组成。几个功能模块并非独立的,而是以
40、综合查询分析平台为基础以数据修正为纽带紧密的结合起来通过层层推进并迭代的方式,不断促进数据中心的数据质量的提高,同时也帮助各个业务系统提交各自的数据质量。通过数据监控看板发现数据错误,针对错误联系业务系统运维人员或业务部门对业务数据进行纠正。使用数据修正功能对“脏数据”进行处理,可以手动执行ETL程序重新抽取剔除错误数据。每周根据数据监控看板的内容,按业务部门、业务系统、错误类型和质量变化趋势出具数据质量分析报告。以促进数据中心应用为主线,在应用中动态地提高数据质量。数据质量监控 在ETL设计过程,需要针对每个流程设计错误流程并且定义错误类型。每个ETL流程遇到错误时写入容错库中。数据质量监控
41、 数据修正使用使用数据修正使用使用Informactica提供的提供的WebService接口,接口,通通过调用用WebService可以在以可以在以Web的形式的形式调用用ETL程序程序对出出错程序程序进行行处理。理。数据质量监控 利用利用Cognos展展现分析功能,分析功能,对错误库中的数中的数据按出据按出错时间,出,出错类型,隶属型,隶属业务部部门,隶,隶属属业务系系统等等汇总,可以得到数据,可以得到数据质量分析量分析报告。告。该报告也可以使用告也可以使用Cognos的的导出功能出功能实现。工作任务工作任务工作量数据抽取数据抽取从源系统到分析环境的数据抽取结构复杂且封闭,直接抽取难度大,
42、考虑增量模式抽取需要大量开发工作数据整合数据整合转换、更新规则开发不能通过简单配置方式得到有效数据整合,仍需大量客制开发分析模版分析模版分析模版开发在通用平台上基于业务分析需求单独建立和维护分析模版数据展现数据展现同现有门户集成Cognos接入门户实现方案单点登陆开发通过Cognos单点登陆实现方式运行维护运行维护 运维管控需求变动、系统性能维护牵涉面广,流程复杂,代价较高。总评总评ETL/分析模版等大量工作需要客制化开发,工作量大,且后期运维代价高紧耦合专业分析建设业务驱动力紧耦合技术路线已明确,紧耦合分析提上建设日程项目财务物资项目-物资分析举例n消耗量分析:按单位,项目性质,项目类型,项目阶段,物资类别,时间等维度,对物资数量,物资金额的计划值,实际使用值进行对比分析。项目财务分析举例n项目投资规模分析n项目资金结构分析n资金执行情况分析n项目资金来源分析物资-财务分析举例n 物资采购金额数量分析套装软件内专业分析成熟度高套装软件提供成熟分析模版电网企业管理分析需求集中,实施成熟度高分析耦合性要求多实施路线成熟度高81