《元数据管理方案.docx》由会员分享,可在线阅读,更多相关《元数据管理方案.docx(11页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、元数据管理方案相同名称的元数据标准。元数据标准维护元数据管理方案1.1 元数据抽取为了简化元数据生成工作,系统提供自动生成元数据的功能,即元 数据抽取。经过元数据自动抽取,用户能够方便、快捷地获得大量的元 数据信息。1.1.1 抽取的对象元数据抽取主要针正确对象有以下几种:已有目录:已建业务应用系统中现有的目录资源。数据库:各种数据库资源,包括关系型数据库、XML数据库 等。格式化电子文件:电子文件,例如Word、PDF、XLS等文 件。1.1.2 元数据抽取的流程元数据抽取的流程有4个主要步骤,分别为:数据源信息获取:解决要从哪个数据源获得元数据的问题。内容/结构分析:解决要从数据源中获得哪
2、些元数据的问 题。元数据提取:解决如何从数据源中获取元数据的问题。存储入库:解决元数据存储的问题。1.1.3 电子文档的元数据抽取对于电子文档,首先各部门的文档格式不尽相同,另外它们的安全 级别也各不相同,同时由于信息化建设水平的不一致,有的部门文档分 散在各处,有的部门文档是集中存放的,甚至已经建立了完善的电子系 统进行管理。针对以上状况,对于电子文档的元数据抽取需要进行以下的抽取流 程: 整理归档对于分散在各处的电子文档(纸质文档需要先进行电子化处理),必 须由专人进行统一整理,根据公开共享的前提进行集中,这种集中能够 是物理上集中的,也能够是逻辑上集中的。但要满足以下原则,第一根 据安全
3、级别,便于外界访问;第二便于文档的增量发布;第三便于采集 工具的自动化采集编目。各部门只有在文档完全整理归档的情况下,进 行自动化采集才是切实可行的。在整理归档的时候,各部门根据各自情 况进行归档,没有必要千篇一律,也没有必要制定繁琐和呆板的规则, 只要能够满足以上的原则即可。 根据安全级别,建立相应的访问机制由于受到安全级别的限制,因此对于需要共享的数据要进行安全方 面的限制,限制的手段能够有:用户名/密码、数字证书、物理隔断等 等,根据实际情况建立安全访问机制,做到重要信息不泄露,不丢失。编目处理现阶段,主流格式的电子文档,主要包含:word、excel ppt、 pdf等。对主流格式的电
4、子文档,要提供自动采集工具进行编目处理。 采集的范围主要是文档的标题和内容,对于其它的元数据内容,要提供 手工配置的方式进行辅助。另外,在工具的采集效率上,要提高增量文 档发布后的采集效率。对于格式特殊、内容有加密算法的文档,是很难经过抓取工具进行 采集的,这些文档主要经过手工编目的方式来处理。对于存在管理库的文档,就需要对数据库来进行编目采集,详见数 据库元数据抽取部分。 保存元数据采集后的数据要放到数据库或者保存到硬盘上,另外要根据目录体 系标准,把数据分解为元数据,然后进行存储1.1.4 数据库元数据抽取数据中心需要抽取的数据库类型主要为Sql server,首先利用ETL 工具从源数据
5、库中将所需数据抽取至中心数据库基础业务库中,在利用 元数据著录工具对抽取出来的数据进行元数据著录。1.2 元数据著录根据元数据标准定义的元数据项,提供著录界面,针对每一个 著录项的特点,提供文本框、列表框、复选框等录入形式。元数据内容录入元数据内容录入用于元数据内容的录入处理,根据元数据库对各类 信息元数据的定义,帮助和引导录入人员建立符合要求的信息资源元数 据。元数据内容录入动态地完成编辑元数据所需的处理,包括元素内容 编辑组件动态生成、元素关系自动关联和元素值域检查等。其中编辑组 件动态生成功能根据元数据标准定义的元素数据类型和取值方式动态地 确定界面编辑组件的形式,使界面极具友好性;元素
6、关系自动关联保证 了元素之间的约束关系能够被编辑器自动的处理,减少了由于编辑人员 对标准的理解错误而产生元数据结构错误的可能;元素值域检查可对用 户输入的数据的有效性进行判断,以确保元数据信息内容的正确性。 标准逻辑分析元数据采集系统对描述元素的处理不依赖于特定的元数据标准,也 就是说采集系统对元数据标准逻辑的分析和处理是独立于标准本身的。 采集系统的标准逻辑分析功能经过元数据标准的XML描述获得元素之间 的制约关系、值域等处理逻辑。因此编辑器能够很好的适应标准的不断 更新和升级。 元数据完整性检查为保证元数据的完整性,编辑器提供了元数据完整性检查功能。利 用该功能,编辑器能够在输出文档之前对
7、各个描述元素的组织关系、元 素内容的完整性加以检查,发现编辑过程中可能遗留的问题,并提示用 户加以修正。经过完整性检查的元数据将严格复合相应元数据内容标准 所做的规定。 联机帮助处理用于完成系统联机帮助的查询、显示操作。1.3 元数据审核元数据审核主要用于元数据报送到数据中心接收数据库但还没正式 发布到发布数据库的元数据。元数据有效性审核分为自动审核与手动审核两个部分,数据在接受 报送系统报送数据时会启动自动审核系统对数据进行初步的有效性审 核,主要以过滤数据结构性错误为主,例如缺少字段、类型错误、编码 缺失或不可识别字符编码等。如果自动检查发现错误,会将错误数据放入问题数据栏,以便数据 管理
8、员进行人工审核,如果人工审核认为数据没有问题,可强制确认有 效,系统会自动提交勘误报告给系统管员,作为自动审核功能改进的依 据,如果数据管理员也认为数据有误,能够将元数据退回给报送系统, 由报送系统转交给报送部门从新报送。手工审核设计包括确认无误、退回重报、打印错误清单、直接更新 元数据内容、打印元数据内容等功能,为了安全起见,更新元数据功能 会记录详细的操作审计日志。1.4 元数据发布如果接受数据库中的元数据已经经过审核(手动或自动),元数据 将自动进入待发布流程,能够从元数据管理平台的待发布数据栏中看到 所有等待发布的数据,数据管理能够在此页面中看到所有等待发布的数 据,并作最后确认,系统
9、在等到发布确认消息后会成批的将所有报送上 来的原数据从接受数据库中转移到发布数据库中,完成正式的发布过 程,同时发送消息给报送单位,提示发布成功。元数据发布审核设计包括确认发布、确认无效、打印发布清单、直 接更新元数据内容、打印元数据内容等功能,为了安全起见,更新元数 据功能会记录详细的操作审计日志。1.5 元数据入库当元数据著录完成并经过语法检查后,可经过目录服务上传到元数 据库中。 元数据检查元数据检查是指检查员对操作员生成的元数据进行合法性检查。主要检查信息资源元数据的内容、格式符合标准规范的要求,信息 资源元数据内容必须符合元数据规范的要求。形式化审核工作由工作系统自动完成。其它非形式
10、化的审核工作, 例如资源分类是否准确、主题词提取是否准确等等,需要由检查员完 成。未经过审核要求的政务信息资源元数据需要操作员重新修订后提父。 元数据入库元数据经过检查后上传到元数据库中存储。1.6 元数据维护元数据维护主要用于维护、查看已发布的元数据,由于元数据发布 需要经过严格的审核流程,一旦审核经过,原则上元数据的更改需要重 新走元数据申报流程,包括已发布元数据的实效申请和新元数据的添加 申请,而不允许对已发布的元数据进行直接修改。但为了应急,特设立 了此功能,但此功能只能开放给核心管理用户使用,为了安全起见,元 数据维护功能的所有操作都记录到操作审计日之中去。普通管理员只有查看、检索元
11、数据的权限。而管理员除了具有查 看、检索元数据权限外,能够使用新增目录的功能,将元数据字典中定 义的目录结构添加到现有的目录中去,而且能够修改、更新、删除元数 据。元数据维护设计包括根据元数据字典创立目录、打印现有目录结 构、根据目录发现、查找元数据、查看元数据内容等功能,核心管理层 还能够查询、修改、删除、移动已经发布的元数据内容。1.6.1 元数据查法系统提供基于元数据项的查询功能,用户在输入需要查询的信息后,系统自动搜索数据集的元数据信息,返回相关的查询结果。1.6.2 元数据浏览在数据集查询界面,系统以列表的形式展现重点元数据信息内容, 若用户需要查看元数据详细信息,能够点击查看元数据
12、属性按钮,浏览 详细的元数据信息。注:图中数据为示例数据,仅为更好的提供具体展现设计使用,不 代表现实情况。1.6.3 元数据更新元数据更新采用两种模式,一种是基于单个数据集的元数据信息修 改模式。用户能够点击修改按钮对该数据集的元数据信息进行修改,修 改完成后提交审核。另一种模式是元数据库批量更新。1.6.4 元数据删除系统提供元数据删除的功能。没有经过审核的元数据信息能够由创 立者或管理员完成,对于已发布的元数据须由管理员进行删除。1.7 元数据配置管理系统提供元数据类别标准的管理和配置功能: 元数据属性维护原数据属性包括:字符型、数字型、日期型、大字段型、Bool型等 多种类型。点击保存按钮能够保存该元数据标准,保存时判断是否存在