《“信息孤岛”问题与信息整合.docx》由会员分享,可在线阅读,更多相关《“信息孤岛”问题与信息整合.docx(9页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、利用信息整合技术解决“信息孤岛”问题1 信息孤岛的形成与弊端所谓的“信息孤岛”,是指相互之间在功能上不关联互助、信息不共享互换以及信息与业务流程和应用相互脱节的计算机应用系统。应当看到,在整个信息技术产业飞速进展过程中,企业的 IT 应用也伴随着技术的进展而前进。但与企业的其它变革明显不同的是, IT 应用的变化速度更快,也就是说,企业进展的每一次局部的 IT 应用都可能与以前的应用不配套,也可能与以后的“更高级”的应 用不兼容。因此,从产业进展的角度来看,信息孤岛的产生有着一 定的必定性。从企业的自身缘由分析,前期的信息化建设大多缺乏长远与统筹规划,不同阶段只考虑各种局部需求,造成了各种不同
2、应用系统的盲目引进,如其中有上级部门下发推广的,也有自行开发或合作开发引进的等渠道。由于大多数应用系统之间没有统一的技术和数据标准,数据不能自动传递,缺乏有效的关联和共享,从而形成一个个彼此隔离的信息孤岛。信息孤岛有“单项孤岛”和“系统孤岛”之分,它们的存在所带来的弊端是显而易见的。首先是导致信息的多口采集、重复输入以及多头使用和维护,信息更的同步性差,从而影响了数据的全都性和正确性,并使企业的信息资源拆乱分散和大量冗余,信息使用和治理效率低下,且失去了统一的、准确的依据。其次是由于缺乏业务功能交互与信息共享,致使企业的物流、资金流和信息流的脱节,结果造成账账不符、账物不符,不仅难以进展准确的
3、财务核算,而且难以对业务过程及业务标准实施有效监控,导致不能准时觉察经营治理过程中的问题,造成打算失控、库存过量、选购与销北京赛迪世纪信息工程参谋第 1 页 共 9 页售环节的暗箱操作等现象,给企业带来无效劳动、资源铺张和效益流失等严峻后果。再次是孤立的信息系统无法有效地供给跨部门、跨系统的综合性信息,各类数据不能形成有价值的信息,局部的信息不能提升为治理学问,以致对企业的决策支持只能流于空谈。同时由于企业信息孤岛的存在,还将影响信息化的集团化、行业化应用。2 信息整合2.1 信息整合的含义信息整合就是通过各种有效的手段和工具将已有信息集合在一起,生成满足不同用户需求的的信息集合体,在已有信息
4、的根底上实现信息价值的增值。信息整合的目标是融合外部信息、消灭信息孤岛、实现信息增值,提高信息的利用率。2.2 信息整合的作用与目标(1) 信息整合可以使企业内分散的文件、技术资料、工程图纸、设备图片、闻素材、音像资料、日常宣传资料、规章制度等信息资源都被有效地治理起来,经过不断的积存将成为企业资源,便利 企业员工查询。(2) 信息整合可以使企业对有用信息资源实施有效治理;实现员工协同工作、应用系统协同工作;综合、统一利用现有信息资源, 提高数据使用率;为每个员工供给共性化信息平台,治理自己需要 的信息,提高工作效率。在不增加应用系统的前提下,提高信息系 统的综合效能。(3) 信息整合以后,企
5、业不必担忧不同应用系统、异构数据库间的集成问题,可以分步推动企业信息化建设,在此进程中逐步提高企业自身的信息技术水平,进而增加对企业信息化建设的操控力气,选择优秀的产品和资质信誉好的集成商不断推动企业信息化建设,避开一次性大量投资给企业带来损失。另外,利用信息整合技术可以将企业已经建成的应用系统与建成的应用系统集成到统一的企业信息平台,不必因其软件技术落后而淘汰它们,不必因更换应用软件而再进展培训,保护原有投资。(4) 利用信息整合技术,可以将企业的信息资源有效治理和综合利用,从而为企业领导供给定制信息、供给综合经营报表、供给多种数据呈现方式,为企业领导决策供给依据。通过信息整合,可以到达如下
6、目标:(1)消退信息孤岛,使企业信息系统形成互通互联的整体(2)形成了各个应用系统的统一访问入口(3)供给满足信息安全的统一数据公布平台(4)供给了已有业务系统升级的手段(5)为建立企业决策系统供给了数据预备(6)解决了数据不标准、编码不全都等问题(7)标准了信息模型,遵循国际标准(8)形成了“按需定制”的企业信息架构2.3 信息整合的三个层面(1) 数据整合数据是组成信息的根本元素,各种原始数据的积存与集中是一个组织机构开展业务的底层根底,而这些数据大多数是由各种应用系统所生成的构造化数据。企业的构造化数据存放在各种不同的数据库中,增加的每个企业应用系统都会带来一系列的构造化数 据。数据整合
7、就是对分散异构的多数据源实现统一的访问,实时地、智能地将有价值的数据传递给分析系统或其他应用系统,进展信息 的进一步加工。数据整合的目的是将不同的数据库集成起来,供给 一种单一的虚拟数据库,这样就不会消灭与核心业务不全都的多个 数据库,保持应用软件数据相互全都并与企业实际状况相符。(2) 内容整合内容是指非构造化的信息,例如电子表格、文本文件、图像、图表、报告、音频文件和视频文件等。这类信息通常占企业信息的80%左右。在进展内容整合时,企业可以建立一个内容治理平台,以供给对非构造化信息的治理功能。公司的文件、图片、多媒体等办公信息,搜寻软件搜寻整理的信息,翻译系统翻译的信息等非构造化信息可以进
8、入内容治理系统。内容治理系统对各类信息进展编、审、校等步骤,对各类信息进展分类治理,并把握信息的公布与访问权限。(3) 过程整合在数据整合与内容整合的根底上,企业可以寻求业务过程的整合。过程整合能将企业规章和过程转移到企业应用软件以外,变成一种 外在的过程和规章引擎。过程和企业规章的这种外在转移增加了灵 活性,从而可以对过程的改善或者的商业时机做出更加有效的反 应。最终,通过提高外在的和内在的过程自动化水平,可以提高过 程执行的整体效率,到达优化过程的目的。信息整合主要的建设任务、用时估算及它们之间关系如图 1-1 及其相关文字说明。:3 个 月:较长期限内的叠代过程,与工程的建设相关:调研预
9、备形成总体技术架构及标准总体框架检测、试点征求意见、改进评审等调研实施标准制定形成草案标准公布、执行培训分析争论至少3个月:612个月数据的抽取转换、加载整体数据集成:数个月,与工程验收工程试运行共享数据应用集成北京赛迪世纪信息工程参谋第 5 页 共 9 页:这个阶段要做的是:对企业的业务、治理活动中发生的数据进展调研、分析、整理、提炼、描述出数据的构成。数据间层次构造、数据间相互关系,建立体系化数据资源体系的过程。是从企业数据流的视角对数据构造进展一个全面、系统的对待,最终形成标准总体框架详见后续章节的描述、业务数据分类及数据治理技术架构等。主要解决“有哪些数据”、“数据之间什么关系”、实行
10、怎样的技术、方法和架构进展数据治理、共享的问题这也反过来对标准框架的涉及产生影响。这局部工作一般是通过前期的咨或者可行性争论工作来完成。而且,只有在这局部工作完成后,后续工作才有了依据,招标中才可以明确地告知投标人需要做什么。例如,假设在前期的工作中未形成标准总体框架,那么在招标中也就无法清楚地告知投标人招标人具体地需要那些标准。投标人就会依据自己的阅历及对招标工程的理解给出解决方案这往是不能到达用户要求。投标报价也会相差较大,给评标带来很大困难。:这个阶段要做的是相关标准的制订阶段具体过程见后续章节,是一个相对标准的过程。这个阶段的关键要点是: 在编制前面标准体系的根底上,明确急需制定的一系
11、列关键技术标准,包括数据治理的总体标准、数据标准、交换标准、技术标准和治理标准等 实现互联互通、信息共享、业务协同、安全牢靠运行的前提和北京赛迪世纪信息工程参谋第 6 页 共 9 页根底。这句话可以是所完成的标准化内容应到达验收目标。推断本工程工程标准质量好坏的唯一准则是该标准是否能够正确地指导工程建设和运营维护,到达工程的建设目标。因此要把数据能否正确地进展共享与交换,业务处理是否正常,治理标准是否能够确实指导、约束承建单位的行为,运营维护标准的有用性等方面作为质量标准,结合使用标准的参建单位和专家评审意见,最终确认工程标准的质量是否到达合同要求。标准是否能够正确地指导工程建设和运营维护,可
12、以通过测试或者试点的方式进展,这两种方式各有优势,可以依据用户的实际状况进展选择。:在前面两个阶段的工作成果根底上,依据标准标准中规定的总体框架和技术架构,建立统一的信息共享平台,从技术层面上为整合各个部门的数据资源供给保证。信息共享平台的建设可以在标准建设进展到确定阶段例如草案根本完成的时候即可启动,而不愿定要等到标准经过评审甚至验证后再进展 可以依据用户的需要进展安排。:本是将需求变为实际系统的最重要的局部,也是数据整合的关键点之一。在这里,共享数据库操作型数据和数据仓库建模和设计是重点,数据仓库的建模和设计需要投入大量的技术阅历。数据仓库内部的模型分为不同的层次,每个层次又承受不同的数据
13、模型进展存储。大体来说,数据仓库根本分为两个层次,一是数据登台区,二是星型模型区,在这两个区域用不同的数据模型进展存储。一般数据登台区根本承受和数据源一样的构造,也就是传统的范式数据构造,而在星型模型区一般都是承受由维表和事实表构建的星型构造。将数据从原始的数据源之中抽取、转换和加载也是在这个过程中进展的。ETL 的设计开发就是用于对数据进展清洗,数据源有可能来至于各种业务系统,也可能是系统之外的数据,这些数据以各种形式存储, ETL 的功能就是要将这些不同的数据源进展清洗流程整合到一个统一的数据仓库中。数据清洗又称为合并 /净化问题(merge/purge ): 它涉及到记录联接(recor
14、dlinkage)、语义集成(semantic integration)、实例标识(instance identification), 对象识别问题,数据清理目的就是要在数据中消退错误和不全都,并解决对象识别的问题。重复数据清理的公认的方法:对合并/净化问题用根本的排序冷 fl 居方法进展解决的过程。清洗主要是针对系统的各个环节可能消灭的数据二义性、重复、不完整、违反业务规章等问题,允许通过试抽取,将有问题的纪录先剔除出来,依据实际状况调整相应的清洗操作。客户数据清理的六个步骤: 元素化(elementizing): 将数分解为最小的原子单元 标准化(standardizing): 将缩写,大
15、小写等都转换为同一格式 校验(verifying):利用规章或已有的数据集合验证数据的有效性 匹配(matching):主要是判别冗余数据 户主化(householding): 主要是确定数据之间的联系 文档化(documenting): 将清洗好的数据以同一的标准格式保存:这个阶段对数据进展整体集成、在共享数据的根底上,实现应用集成操作型应用,对于分析型的应用,主要是设计和开发前端呈现的程序,也就是要使用这个程序具将数据仓库和多维数据库中的数据呈现出来。这个应用程序根本上分为两种构架,一是 CS 方式, 通过客户端安装软件,server 进展数据的存取,二是BS 方式,通过扫瞄器如 IE,对效劳器的数据进展扫瞄分析。在数据仓库开发的期初,数据仓库主要应用于企业的内部,所以 CS 的方式应用较多,在随着数据仓库的进展,BS 构架的应用越来越多应用于企业的商业分析之中。