《中文元数据标准研究及其示范数据库.ppt》由会员分享,可在线阅读,更多相关《中文元数据标准研究及其示范数据库.ppt(39页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、中文元数据标准研究及其示范数据库项目进展及其成果应用肖珑肖珑北京大学图书馆北京大学图书馆2004年年11月,南京月,南京11.项目进展情况2.描述元数据规范及其设计指南3.开放实验及应用4.结语主要内容2n历史回顾(一):2000年6月,北京,第一次中文资源共建共享会议立项名称:中文元数据标准研究及其示范数据库负责单位:北京大学数字图书馆研究所n北京大学图书馆nCALIS管理中心n北京大学信息科学技术学院1.项目发展情况3n历史回顾(二):n2002年9月,澳门,项目进展汇报中文元数据标准框架元数据规范:n古籍n拓片n舆图n学位论文n电子图书n网络资源1.项目发展情况4n历史回顾(三):200
2、2年12月,国家科技部重大基础课题“我国数字图书馆标准规范建设”n包含10个子项目,三个与元数据相关“专门数字对象元数据标准规范”子项目由北京大学图书馆负责与本项目合作,共同发展1.项目发展情况5n项目目标针对具有中国特色和在我国广泛应用的数字对象,分别建立相应的数字规范,包括格式定义、语义定义、开放标记规范、内容编码体系、扩展规则,建立各种专门元数据与基本元数据的标准转换关系和转换模板,建立各种专门元数据与其它专门元数据的标准转换关系和转换模板,编制各个专门元数据的应用指南,选择推荐专门元数据编制模块,建立基于专门元数据的一个应用协议编制指南,建立专门元数据定义信息、应用协议和转换工具的等级
3、机制。1.项目发展情况6n建设任务1.跟踪分析国内外元数据标准规范的发展与应用趋势,提出关于专门数字对象元数据的性质、特点、描述体系、应用体系的分析报告。2.选择合适的专门数字对象类型,建立相应的专门数字对象元数据格式及其编码体系、使用指南、使用范例、编制模块等。3.建立专门数字对象元数据的扩展规范和应用协议编制规范,建立各个专门数字对象元数据与基本元数据和其它专门元数据的标准转换关系和转换模板,提供基于专门元数据进行交换和互操作的基础。4.建立专门数字对象元数据的开放描述、应用管理和公共登记规则,并在数字图书馆标准规范开放建设框架内建立专门数字对象元数据开放建设机制。1.项目发展情况7n参加
4、研制单位北京大学图书馆(组长单位)上海图书馆(副组长单位)国家图书馆科学院文献情报中心CALIS管理中心清华大学图书馆上海交通大学图书馆1.项目发展情况8n已经完成的元数据规范古文献:古籍,拓片,家谱,地方志,舆图;论文:学位论文,会议论文,期刊论文;图书:电子图书(教学参考书);音频资料;原生数字资源(born-digital):网络资源1.项目发展情况9n其它完成的任务国内外元数据现状与发展趋势调研国内数字资源对象及其元数据标准发展状况分析描述元数据规范设计指南描述元数据核心元素集;11种专门数字对象分析报告11种专门数字对象元数据规范;11种专门数字对象元数据的相关著录规则;开放著录实验
5、系统及11种元数据著录子系统;中心实验网站;一定数量的实验数据1.项目发展情况10n参加开放实验单位国家图书馆,上海图书馆北京大学图书馆,清华大学图书馆,上海交通大学图书馆,北京师范大学图书馆,四川大学图书馆,中国人民大学图书馆,中国农业大学图书馆,中山大学图书馆,浙江大学图书馆,西安交通大学图书馆,复旦大学图书馆,上海音乐学院图书馆,上海外国语大学图书馆,上海大学图书馆,中央音乐学院图书馆,协和医科大学图书馆,南京大学图书馆CALIS管理中心中国科学院文献情报中心1.项目发展情况11n描述元数据规范设计指南为保证各种元数据规范在功能、数据结构、格式、语义语法等方面的一致性和整体性同时也为在更
6、大范围内实现与系统或数字图书馆之间的互操作和数据共享用于指导各元数据规范的设计与应用。2.描述元数据规范及其设计指南12n设计指南主要内容描述元数据的定义及功能描述元数据规范的设计原则描述元数据的基本结构、元素组成与扩展规则描述体系与定义方法元数据规范应用的相关规则设计流程与工作规范文档规范 2.描述元数据规范及其设计指南13n定义及其功能:描述元数据:即用于描述或标识数字对象内容的元数据。功能n描述n定位n管理n检索n评估和选择n交互2.描述元数据规范及其设计指南14n设计原则需求分析对象分析简单性与准确性原则专指度与通用性原则互操作性与易转换性原则可扩展性原则用户需求原则2.描述元数据规范
7、及其设计指南15n基本结构核心元素:在各类资源对象中通用。核心元素复用DC的15个基本元素。拟在该层上与其它系统进行交换,支持通用的检索工具。资源类型核心元素:根据资源对象特点、参照其它元数据标准制定,在同一类型数字资源中通用。不同的资源类型可有不同的资源类型核心元素设置及其语义定义,应用时要求遵守本资源类型的相关规则和定义。个别元素:以某种特定的资源对象为基础制定,仅适用于这类对象,不用于交换。应用时仅要求该种对象遵守其定义。2.描述元数据规范及其设计指南16n核心元素集复用DC的原则(一):1.采用“简单DC”(simpleDC),不推荐使用“限制性DC”(qualifiedDC)。2.严
8、格遵守其元素语义定义。核心元素集中元素的语义不允许有交叉。3.核心元素并非必备元素,允许只复用其中一部分。2.描述元数据规范及其设计指南17n核心元素集复用DC的原则(二):4.允许复用“限制性DC”中的修饰词(qualifier),必须说明并严格遵守其语义定义。5.允许在复用时根据资源情况重新命名元素和修饰词。6.与DC的映射:n映射单位可以是元素,也可以是修饰词;n可以建立一对多(如一个元素与DC的多个元素)、多对一(多个元素与DC的一个元素)的映射关系。2.描述元数据规范及其设计指南18n资源类型核心元素举例:古文献系列核心元素:n版本n载体形态n收藏历史n馆藏信息n个别元素举例:学位论
9、文n学位2.描述元数据规范及其设计指南19n扩展规则横向扩展规则(元素层次)n核心元素、资源类型核心元素、个别元素 纵向扩展规则(修饰词层次)n修饰词:元素修饰词、编码体系修饰词n尽可能采用Dump-down原则n其它元数据规范修饰词的应用部分元素取值规则nType元素:参见“信息资源名称规范列表”nFormat元素:参见“数字资源加工标准与操作指南”子项目成果2.描述元数据规范及其设计指南20n借鉴ISO/IEC11179标准,按以下12个方面定义元素和元素修饰词:n名称(Name):n统一资源标识符(URI):n标签(Label):n版本(Version):n注册机构(Registrati
10、onAuthority):n语言(Language):n定义(Definition):n术语类型(Type of Term):n数据类型(Datatype):n频次范围(Occurence):.n修饰(Qualifies):n注释(Comment):2.描述元数据规范及其设计指南21n著录规则:为开放实验编写1)引言2)总则3)各元素/修饰词的著录细则4)参考文献n规范档n检索说明2.描述元数据规范及其设计指南22n设计流程与工作规范1.资源分析2.初步设计3.征求意见4.手工著录实验5.再次征求意见6.完成元数据规范(初稿)7.建立实验系统及中心实验网站8.相关著录规则9.开放实验10.第三
11、次征求意见11.形成元数据规范(修订稿)12.公开应用13.形成元数据规范(推荐稿)2.描述元数据规范及其设计指南23n文档规范文字规范资源分析报告资源类型核心元素集元数据规范著录系统及其子系统需求著录规则著录实验报告2.描述元数据规范及其设计指南24n描述元数据规范举例:古籍舆图家谱地方志学位论文音频资料会议论文2.描述元数据规范及其设计指南25n开放实验中心实验系统中心实验网站nhttp:/162.105.139.81:8080/metac/著录规则数据质量控制规则20多个参加单位60,000条实验数据3.开放实验及应用26n开放实验系统功能支持以WEB方式的网上元数据著录方式;不同的专门
12、数字对象描述元数据规范的定义与维护;支持多个元数据标准规范的著录规范;依据核心集转换规则实现元数据集的互转;支持著录实验数据以XML的导入与导出;支持著录实验数据以简单文本格式的导入与导出;支持元数据著录对象的显示;支持简单的实验数据检索要求、全文检索、统一检索用户管理与统计功能;数据管理功能(支持临时库、主库及数据审核功能);系统日常维护功能;系统帮助功能。3.开放实验及应用27n开放实验系统功能模块元数据著录模块元数据检索模块数据管理模块用户管理及统计模块系统管理模块帮助模块3.开放实验及应用2829303132n应用项目CALIS高校学位论文数据库CALIS重点学科专题数据库CALIS重点学科导航数据库CALIS教学参考书数据库CADAL中美百万册书项目中国科学文献服务系统(ScienceChina)北京大学数字图书馆古文献资源库(祕籍琳琅)其它3.开放实验及应用33343536n下一步发展扩大开放实验修改元数据规范完成元数据规范推荐稿专门数字对象元数据规范的开放应用机制推广应用增加更多的数字对象,扩大项目4.结语37谢谢!381.http:/162.105.139.81:8080/metac/2.http:/