书目数据新格式BIBFRAME及其应用.docx

上传人:w**** 文档编号:11674099 上传时间:2022-04-21 格式:DOCX 页数:12 大小:35.11KB
返回 下载 相关 举报
书目数据新格式BIBFRAME及其应用.docx_第1页
第1页 / 共12页
书目数据新格式BIBFRAME及其应用.docx_第2页
第2页 / 共12页
点击查看更多>>
资源描述

《书目数据新格式BIBFRAME及其应用.docx》由会员分享,可在线阅读,更多相关《书目数据新格式BIBFRAME及其应用.docx(12页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、书目数据新格式BIBFRAME及其应用书目数据新格式BIBFRAME及其应用 本文关键词:及其应用,书目,格式,数据,BIBFRAME书目数据新格式BIBFRAME及其应用 本文简介:摘要:MARC格式被认为是目前制约图书馆数据开放利用的最大障碍,已经不适合当前的编目环境。基于书目控制的历史和当前背景及需求,通过剖析新的书目框架格式BIBFRAME的关联数据模型、需求与用例、工具与服务,分析其开放性、语义化、向后兼容性等特点,提出其在应用上将遇到技术门槛过高、与FRBR/RDA等书目数据新格式BIBFRAME及其应用 本文内容:摘要:MARC格式被认为是目前制约图书馆数据开放利用的最大障碍,已

2、经不适合当前的编目环境。基于书目控制的历史和当前背景及需求,通过剖析新的书目框架格式BIBFRAME的关联数据模型、需求与用例、工具与服务,分析其开放性、语义化、向后兼容性等特点,提出其在应用上将遇到技术门槛过高、与FRBR/RDA等已有标准的融合与冲突、与Shema.org的竞争与合作关系等问题。BIBFRAME不仅是MARC的替代品,还将为图书馆数据融入更广阔的互联网环境带来巨大的潜力和可能性。关键词:MARC书目框架语义网关联数据书目数据是图书馆进行书目控制的重要基础,是揭示馆藏、开展服务的主要工具,也是传统图书馆对于知识进行组织和整序的最有价值的贡献。数字时代的书目数据虽然只是图书馆类

3、型丰富的元数据中的一种,但它肩负着将纸媒带人数字时代的重任,同时又是出版物得以传播利用的重要桥梁,因此其重要性并没有降低。当前最大的问题是如何将书目数据开放成真正的万维网上的数据?这其实并不是系统实现问题,而是书目数据格式问题。由于语义技术的发展,人们才真正明白,MARC格式是当前制约图书馆数据开放利用的最大障碍,网络时代呼唤新的书目数据格式。1背景和历史MARC格式设计于上世纪60年代末。当时计算资源极其匮乏,计算机速度慢,存储介质昂贵,以磁带这种顺序存取介质为主,因此MARC记录格式(即2709格式)被设计为不定长字段的紧凑型格式,以记录为单元,每条记录代表一个编目单位。MARC最初的设计

4、目的是为了打印目录卡片,后来有条件的图书馆逐渐开放了检索终端,发展为后来的标准OPAC服务。由于磁带格式只能顺序检索而无法随机存取,因此在格式中设计了很多机器识别码、记录及字段子字段标识,以便能通过倒排索引而迅速定位检索。后来虽然随机存储介质(磁盘)和关系型数据库技术得到普及,但2709格式依然作为MARC记录的交换格式,图书馆的MARC记录虽然都可以通过万维网查询,但除了按照客户机/服务器时代研发的Z39.50标准开放API接口之外,基本没有其它互操作方式,MARC数据一直被牢牢地圈养在每个图书馆的OPAC范围内,缺乏方便地生成一个国家或地区的总书目或联合目录的技术和能力,更不用说开放给整个

5、社会各相关行业使用。当今的信息服务业有这样一个趋势:凡是互联网上不存在的,基本上是可以被忽略的。图书馆作为一种向大众传播知识的社会机构,如果遭到大众的忽略,就无法充分实现其职能,因而也无法实现其价值。自MARC产生到现在已经过去了半个世纪,随着技术的发展、信息大环境的改变,读者利用图书馆资源的对象和方式也发生了巨大的改变。MARC格式的种种局限在网络时代越来越成为一个绊脚石,越来越阻碍图书馆行业成为一个与其地位相称的网络存在:首先,互联网让计算机不再是简单的数据处理工具,而成为全球信息空间的一个个节点,书目控制不再局限于某一台机器、某一个系统、某一家机构,而需要在图书馆以外的网络空间进行传输和

6、交换,MARC因其领域上的封闭性已无法满足这种需求。其次,图书馆要保存和处理的资源不仅限于传统的印本图书,还包括诸如电子文献、网页、图像、多媒体等复杂的资源类型,而MARC是为印本图书设计的,虽然曾在网络资源的描述上做过一定的努力(856字段),但效果并不理想。都柏林核心元数据组织(DCMI)很早就看到了MARC对网络应用的不适应,从上世纪90年代中期开始发起了一轮新型元数据研发风暴,试图为MARC等传统的文献描述方式找到替代者。都柏林元数据核心集、术语词表、抽象模型及应用纲要等都是DCMI为网络时代书目控制做出的重要贡献。对于图书馆元数据,DCMI很早就提出一套名为“图书馆应用纲要”的元数据

7、方案,试图实现类似MARC的描述功能,但这个方案只是一个属性元素集合,相对于MARC这种既包含丰富得多的属性元素集、又含有著录和语法编码规则的“复合型”标准来说,远不能满足实际需要,因而一直缺乏大型图书馆的支持而始终停留于草案阶段,未能成为DCMI的推荐规范。在数据编码方式上,MARC虽然号称“机读”,但是其各种内部格式只是被计算机读取,而无法被机器“理解”。DCMI尝试引入RDF/XML作为语义描述规范,但由于图书馆通行的编目规则(AACR2)是和MARC配套的,无法直接采用RDF编码,而且语义技术的实用化也有一个过程,当时还不足以支持大规模的应用,因此MARC的地位长期以来难以撼动。国际图

8、联1998年出版了书目记录的功能需求(FRBR)报告12,提出与书目描述相关的三类实体、属性及其相互之间的关系,指出传统的MARC无法满足报告中提出的这种层次化的、全网域的“查找、标识、搜索和获取(FISO)”四方面的需求。随着以兼容过去并实现FRBR为目标的RDA编目规则的出台,美国国会图书馆对MARC21进行了大量扩展,人们对MARC格式的不满达到了一个顶点。呼吁以新的书目格式取代MARC的呼声早已有之,进入新千年之后更是不绝于耳。加州大学数字图书馆项目前经理、现任OCLC高级项目主管RoyTennant在2002年公开喊出MARCMustDie(MARC必须死)。但它为什么还死不了呢?最

9、主要的原因是一直没有一种能够满足网络时代书目数据功能需求的书目格式来取代它。美国国会图书馆2006年12月成立了未来书目控制项目组,2008年1月提交最终报告OntheRecord,表明将书目控制向万维网推进的积极态度,引发巨大争论。OCLC领导了WaC的Schema书目扩展社区的研究工作,通过对一种由Google、Yahoo和微软等提出的Schema.org编码推荐规范进行扩展,在其WorldCat中尝试基于Schema.org的书目格式,实现基于FRBR的RDA编目数据的网络化。所有这些探索都指向一个目标:直接用万维网原生的技术即以URI、HTTP、HTML/XML为代表的技术来处理和发布

10、信息。随着W3C等标准组织的推波助澜,以及语义网、关联数据技术在图书馆内得到越来越多的应用,美国国会图书馆已经在将VIAF、LCSH等规范词表发布成关联数据,德国、英国、瑞典等国家图书馆纷纷进行了书目数据的关联数据化,推出新一代书目数据格式的时机已经成熟。在这种背景下,基于关联数据技术的“书目框架(BIBFRAME)”应运而生。2022年5月,美国国会图书馆正式宣布与以语义技术起家的Zepheira公司合作开发BIBFRAME,同年10月,国会图书馆发布项目计划,2022年5月,Zepheira公司开始评估相关的项目并开始数据建模,11月书目框架发布第一份报告,公布了所用的关联数据模型草案,同

11、时在书目框架官网上发布用例与需求、不断更新的词表以及适当的工具和服务,不列颠图书馆、德国国家图书馆、OCLC等参与了早期测试。2022年的ALA大会上,书目框架成为热门话题,根据EricMiller等人的报告,目前国会图书馆仍然在根据早期测试的结果修正各种细则,OCLC在研究如何将WorldCat中所有的数据转换成书目框架格式。接下来的工作将更加具体化,如继续更新术语词表,用XML来对书目框架的RDF数据模型进行序列化的试验,开发支持MARC21到书目框架的转换工具、及支持书目框架数据浏览的关联数据浏览器。平台提供商中,目前有图书馆系统服务商VTLS宣称其OpenSkies平台支持书目框架,科

12、罗拉多大学启动了“BIBFRAME数据存储库”项目,在Redis图书馆服务平台上,增加了一个模块,通过MODStoMARC映射实现MARC21记录到BIBFRAME实体的转换。尽管书目框架希望创造一种新的表达书目数据的方法用以取代MARC,但它的目标比此更加宏伟。作为一项计划,BIBFRAME要调研书目描述、数据创建、数据交换等各个方面。除了取代MARC,它还能适应不同内容模型和边际规则,探索新的数据记录的组成方法,以及评估目前的交换协议。书目框架出现之后,废弃MARC的时间已经临近,美国国会图书馆和OCLC都宣布,将于2022年停止对MARC格式的支持,这就意味着MARC即将退出书目控制的历

13、史舞台,书目框架将扮演重要的角色。2什么是BIBFRAME?BIBFRAME全称为“书目框架计划(TheBibliographicFrameworkInitiative)”,也曾称为“书目框架迁移计划(TheBibliographicFrameworkTransitionInitiative)”,它的目的是开发一种“适应未来需求”的书目数据格式,因此也用它来命名这种新的书目数据格式。所谓格式,即适用于某种特定应用的编码和解码的打包方式,书目框架就是对于书目信息按照一定的结构和方式进行编码,并能够满足信息交换等功能需求而进行解码的一种“数据包”。书目框架应用了关联数据技术,能够支持图书馆及类似机

14、构对各类馆藏资源进行描述和编码,其研发的第一个需求是支持数以亿计的MARC数据转换,将来所有新产生的数据将可以不再使用MARC,从而逐步取代MARC21等世界各国沿用至今的MARC,使得书目数据在整个万维网上得到方便的交换、发布和共享。书目框架项目的最终目的,是要形成一套适应万维网的书目信息应用规范,主要包括三个方面:模型与实体、术语词表、编码及打包规则,模型与实体提供了书目框架的应用对象和描述深度,术语词表提供了规范控制的基础,编码和打包规则提供了机器理解的手段。另外书目框架还会开发一些用于数据校验、互操作测试等特定功能的辅助工具,以及发布一些应用平台信息和最佳实践等。目前书目框架的官网除了

15、发布进行中的规范之外,作为一个项目管理网站(部分内容须密码登入),还兼有征求意见、讨论问题和普及宣传相关知识的功能。2.1框架模型与FRBR类似,书目框架采用了实体一关系分析法,对所涉及的实体、实体属性、实体关系、属性关系等进行了分析。但书目框架的分析更一般化,只将描述对象分为抽象的创造性作品(CreativeWork)和实例(Instance)两层,另外根据规范控制和扩展描述的需要,单独定义了规范数据和注释数据,因此一共有四类实体(如图1、2所示):CreativeWork(创造性作品)Instance(实例)Authority(规范数据)Annotation(注释数据)前两者可以通过对MA

16、RC中各类字段属性进行梳理而“继承”,而规范数据与传统规范控制的做法有很大不同,它既要实现传统规范控制对作品、实例及其相关的作者(人物及角色)、机构、主题、事件等要素的规范功能,又有许多网络资源规范控制的特点(如外链VIAF或DBPedia中的RDF数据)。书目框架定义的规范数据格式并非要取代其它的规范控制方法,而是作为一个轻型的抽象层,提供一种容器,使规范控制在万维网环境下更加有效地发挥作用。把对与作品或实例相关的实体的描述都作为“注释”,是书目框架的一种“创造”。它所涉及的各种注释包括目前已经纳入考虑范围的封面设计、书评、描述和馆藏描述四类,其中“描述”又分三个子类:摘要、文摘和目录,其所

17、需描述的属性、关系等完全不同,但它们都是bf:Annotation的子类,这种完全异构的数据只有在书目框架这种采用了RDF描述的模型中才能方便地进行编码,因为我们可以把“注释”类当作一个容器,而不像关系数据库那样,一定要强求结构的统一。目前书目框架只定义了一些急需描述的基本类型,如上述四类和三个子类,主要是考虑到书目框架首先要兼容MARC21,如果在转换MARC21数据时没有对应的映射字段,就无法满足对“框架”的需求。将来可能会根据需要扩展更多的类型,这样的模型也能够直接支持网络中由其它机构组织发布和维护的数据。2.2术语词表规范术语的发布是语义万维网技术的基础,通过为各类实体、属性、关系、取值等相关术语赋予URI,形成词表,为语义编码(一般是采用RDF的各种序列化形式)提供了基本的结构单元。从目前书目框架的实践来看,它已不再像DCMI那样严格控制元素和术语的数量,而是根据实际需要原则,经过一定的内部讨论流程,随时发布和修订。目前术语的主要本文来源:网络收集与整理,如有侵权,请联系作者删除,谢谢!第12页 共12页第 12 页 共 12 页第 12 页 共 12 页第 12 页 共 12 页第 12 页 共 12 页第 12 页 共 12 页第 12 页 共 12 页第 12 页 共 12 页第 12 页 共 12 页第 12 页 共 12 页第 12 页 共 12 页

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > 工作计划

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁