《信息管理概论课件-第6章.ppt》由会员分享,可在线阅读,更多相关《信息管理概论课件-第6章.ppt(99页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、信息管理信息管理概论概论第六章第六章 信息采集信息采集与组织与组织6.1 6.1 信息源信息源与与信息采集信息采集6.2 6.2 信息信息组织组织的一般原理的一般原理6.3 6.3 分分类与类与主主题标题标引引6.4 6.4 元元数数据据6.5 6.5 网络网络信息信息组织组织6.6 6.6 信息信息构构建建信息管理信息管理概论概论6.1 6.1 信息源信息源与与信息采集信息采集信息源信息源概概述述信息采集信息采集信息管理信息管理概论概论6.1.1 6.1.1 信息源信息源概概述述信息源的信息源的3 3个层个层次次 信息源的信息源的类类型型信息源的分布信息源的分布信息管理信息管理概论概论6.1
2、.1 6.1.1 信息源信息源概概述述1.1.信息源的信息源的3 3个层个层次次(1 1)信息最原始的)信息最原始的来来源源 物物质质和和现现象的存在及人象的存在及人类类的的实践实践活活动动(2 2)信息)信息资资源源开发开发机机构构 (3 3)信息系)信息系统统 信息管理信息管理概论概论6.1.1 6.1.1 信息源信息源概概述述2.2.信息源的信息源的类类型型 依不同角度,信息源可分依不同角度,信息源可分为为不同的不同的类类型。型。(1 1)按)按时间顺时间顺序序:先先导导信息源、信息源、实时实时信息源、信息源、滞滞后信息源后信息源 (2 2)按信息)按信息产产生生过过程程:原始信息源、加
3、工信息源原始信息源、加工信息源 (3 3)按信息源在信息布局中的地位)按信息源在信息布局中的地位:强强势势信息源、弱信息源、弱势势信息源信息源 (4 4)按信息的存在形式)按信息的存在形式记录记录型信息源、型信息源、实实物型信息源、思物型信息源、思维维型信息源、型信息源、零次信息源零次信息源信息管理信息管理概论概论6.1.1 6.1.1 信息源信息源概概述述 3.3.信息源的分布信息源的分布 信息源的分布有一信息源的分布有一个总个总的的规规律,即非均衡。律,即非均衡。一是在一是在时间时间序列上,信息源的分布是非均衡的。序列上,信息源的分布是非均衡的。从时从时序上看,信息源的分布遵循社序上看,信
4、息源的分布遵循社会学会学的一的一个发个发展展理理论论:后:后胜胜于今,今于今,今胜胜于古。于古。二是空二是空间间分布也分布也显显示出非均衡的示出非均衡的规规律,律,国国家家与国与国家家之之间间、地、地区与区与地地区区之之间间其信息分布都不均衡。其信息分布都不均衡。此外,信息源在行此外,信息源在行业业、部、部门门、学学科、信息科、信息类类型等方型等方面的分布也存在着非均衡的面的分布也存在着非均衡的现现象。象。信息管理信息管理概论概论纽约时报信息管理信息管理概论概论6.1.2 6.1.2 信息采集信息采集 信息采集的信息采集的实质实质是信息的是信息的选择过选择过程,是根据不程,是根据不断变断变化的
5、用化的用户户信息需求信息需求从从已确定的信息源体系中已确定的信息源体系中连续连续地地选择选择、提取和收求信息的、提取和收求信息的过过程程 。1.1.信息采集的原信息采集的原则则 2.2.信息采集的渠道和方法信息采集的渠道和方法 3.3.信息采集方法信息采集方法举举要分析:要分析:调查访问调查访问 4.4.网络网络信息采集信息采集信息管理信息管理概论概论6.1.2 6.1.2 信息采集信息采集 1.1.信息采集的原信息采集的原则则 (1)(1)针对针对性原性原则则 (2)(2)完整性原完整性原则则 (3)(3)及及时时性原性原则则 (4)(4)预见预见性原性原则则 (5)(5)计划计划性原性原则
6、则 (6)(6)连贯连贯性原性原则则 (7)(7)灵灵活性原活性原则则 信息管理信息管理概论概论6.1.2 6.1.2 信息采集信息采集 2.2.信息采集的渠道和方法信息采集的渠道和方法 信息采集的渠道是指信息采集的渠道是指经经由由哪哪些信息源去采集信息,些信息源去采集信息,信息采集的方法是指到信息源那里采集信息的行信息采集的方法是指到信息源那里采集信息的行动动手段,手段,两两者是密切相者是密切相关关的。的。信息采集的渠道主要有:大信息采集的渠道主要有:大众传众传媒渠道、出版媒渠道、出版发发行行渠道、信息系渠道、信息系统统渠道、人渠道、人际关际关系渠道、文系渠道、文献献情情报报机机构构渠道、渠
7、道、专业专业性性学会学会渠道、行渠道、行业协会业协会渠道、社渠道、社会会中中介机介机构构渠道、信息渠道、信息发发布机布机构构渠道、互渠道、互联网联网渠道、各渠道、各类会议类会议渠道、渠道、邮邮政部政部门门渠道等。渠道等。信息管理信息管理概论概论6.1.2 6.1.2 信息采集信息采集信息采集的方法信息采集的方法(1)(1)内内部信息索取法部信息索取法(2)(2)互通有无的交互通有无的交换换法法 (3)(3)委托采集法委托采集法 (4)(4)实实物物样样品分析法品分析法 (5)(5)实实地考察法地考察法 (6)(6)间间接接调查调查法法(7)(7)网络查询网络查询法法 (8)(8)大大众传众传媒
8、采集法媒采集法 (9)(9)咨咨询询采集法采集法 信息管理信息管理概论概论6.1.2 6.1.2 信息采集信息采集 3.3.信息采集方法信息采集方法举举要分析:要分析:调查访问调查访问 (1)(1)问问卷卷调查调查法法 问问卷的卷的设计设计形式有形式有3 3种种:结构结构式、非式、非结构结构式和混合式。式和混合式。(2)(2)访问调查访问调查法法 此法又叫采此法又叫采访访法,是新法,是新闻闻机机构构常用的信息采集方常用的信息采集方法,法,它它又包括又包括电话电话采采访访、信函采、信函采访访、会议会议采采访访、观观察察访问访问、座、座谈谈采采访访、单独单独采采访访等。等。信息管理信息管理概论概论
9、会议会议采采访访信息管理信息管理概论概论信函采信函采访访之之预约预约信息管理信息管理概论概论6.1.2 6.1.2 信息采集信息采集4.4.网络网络信息采集信息采集 这这里里主主要要是是指指搜搜索索引引擎擎的的信信息息采采集集机机制制和和方方法法,即即对对WWWWWW站站点点和和其其他他网网络络信信息息资资源源进进行行采采集集、标标引引和和检检索索的的一一类类检检索索系系统统机机制制。这这里里主主要要涉涉及及它它的的信信息采集机制。息采集机制。基基本本机机制制:搜搜索索引引擎擎的的信信息息采采集集机机制制是是按按照照一一定定规规律律和和方方式式对对网网络络上上WWWWWW站站点点进进行行搜搜索
10、索,并并将将搜搜索索到到的的WWWWWW页页面面信信息存入搜索引擎的息存入搜索引擎的临时数临时数据据库库。自自动动采采集集器器:是是采采用用自自动动采采集集方方式式的的搜搜索索引引擎擎的的核核心心,是是一一种种在在网网络络上上搜搜索索文文件件、自自动动跟跟踪踪该该文文件件超超文文本本结结构构并并循循环环检检索被索被参参照文件的照文件的软软件。件。信息管理信息管理概论概论信息管理信息管理概论概论6.2 6.2 信息信息组织组织的一般原理的一般原理信息信息组织概组织概念念信息信息组织组织的的3 3个层个层次次 信息信息组织组织的的内内容容 信息管理信息管理概论概论6.2.1 6.2.1 信息信息组
11、织概组织概念念 信息信息组织组织是采用各是采用各种种方法和手段使信息有序方法和手段使信息有序化的化的过过程,程,它它通通过过揭示信息之揭示信息之间内间内在在逻辑联逻辑联系,系,将将其一方面大量、分散和其一方面大量、分散和杂乱杂乱的信息的信息经过经过加工、加工、整理、提整理、提炼炼和和优优化,使之化,使之组织组织化、系化、系统统化,化,从从而而达达到有效利用的目的。到有效利用的目的。信息管理信息管理概论概论6.2.2 6.2.2 信息信息组织组织的的3 3个层个层次次 在信息在信息过滤过滤的的过过程中,存在着程中,存在着3 3个个不同的不同的层层次,即次,即信息的信息的语语法法过滤过滤、语义过滤
12、语义过滤和和语语用用过滤过滤,因而形,因而形成了成了3 3种种不同不同层层次的信息次的信息类类型,即型,即语语法信息、法信息、语语义义信息和信息和语语用信息。用信息。与与此相此相对应对应,信息,信息组织组织也分也分为为三三种种不同的不同的层层次次:语语法信息法信息组织组织语义语义信息信息组织组织语语用信息用信息组织组织信息管理信息管理概论概论 6.2.2 6.2.2 信息信息组织组织的的3 3个层个层次次 1.1.语语法信息法信息组织组织语语法信息法信息组织组织是以信息的形式特征是以信息的形式特征为为根据序化信息的方法。根据序化信息的方法。语语法信息的法信息的组织组织需要遵循方便性、多向成族性
13、和需要遵循方便性、多向成族性和标标准化等原准化等原则则。其重要特征是。其重要特征是标标准化准化.比比较较常常见见的的语义语义信息信息组织组织方法有以方法有以下几下几种种:(1)(1)字字顺组织顺组织法法 (2)(2)代代码组织码组织法法 (3)(3)地序地序组织组织法法 (4)(4)时时序序组织组织法法 (5)(5)上述上述组织组织法所法所没没有囊括的信息有囊括的信息组织组织法,比如法,比如颜颜色色组织组织法法 和和形形状组织状组织法等。法等。信息管理信息管理概论概论商商标条标条代代码码电话号码电话号码6.2.2 6.2.2 信息信息组织组织的的3 3个层个层次次信息管理信息管理概论概论6.2
14、.2 6.2.2 信息信息组织组织的的3 3个层个层次次2.2.语义语义信息信息组织组织它它是以信息的是以信息的内内容或本容或本质质特征特征为为依据序化信息的方法。依据序化信息的方法。语语义义信息信息组织组织需要遵循客需要遵循客观观性原性原则则、逻辑逻辑性原性原则则和和发发展性原展性原则则。比。比较较常常见见的的语义语义信息信息组织组织方法有以下方法有以下两种两种:(1)(1)分分类组织类组织法法它属它属于一于一种逻辑组织种逻辑组织法,常法,常见见的分的分类组织类组织法包括法包括学学科分科分类类、文文献献分分类类、专专利分利分类类、商品分、商品分类类和和职职能分能分类类等。等。(2)(2)主主
15、题组织题组织法法主主题组织题组织法是法是从从事物事物内内涵的主涵的主题题或涉及的或涉及的问题与问题与事物的事物的属属性出性出发发,以,以语词语词作作为概为概念念标识标识,并并通通过概过概念念标识标识的字的字顺顺排排列和列和参参照方法等照方法等间间接地揭示接地揭示概概念之念之间间相互相互关关系的一系的一种种信息信息组织组织方法。方法。信息管理信息管理概论概论6.2.2 6.2.2 信息信息组织组织的的3 3个层个层次次3.3.语语用信息用信息组织组织它它是以信息的效用特征是以信息的效用特征为为依据序化信息的方法。依据序化信息的方法。语语用信息用信息组织组织需要遵循目的性、需要遵循目的性、实实用性
16、和用性和个个性化性化原原则则。常。常见见的的语语用信息用信息组织组织方法有以下几方法有以下几种种:(1)(1)重要性大小重要性大小组织组织法法(2)(2)权值组织权值组织法法(3)(3)概概率率组织组织法法(4)(4)特色特色组织组织法法 信息管理信息管理概论概论6.2.3 6.2.3 信息信息组织组织的的内内容容 信息源外表特征描述信息源外表特征描述初初级组织级组织信息源信息源内内容特征揭示容特征揭示中中级组织级组织信息重信息重组组高高级组织级组织信息存信息存储储空空间组织间组织信息管理信息管理概论概论6.2.3 6.2.3 信息信息组织组织的的内内容容 1.1.信息源外表特征的描述信息源外
17、表特征的描述即信息形式特征的描述,是根据一定的原即信息形式特征的描述,是根据一定的原则则和方法,和方法,对对信信息的外表特征和部分息的外表特征和部分内内容特征容特征进进行全面描述行全面描述并并予以予以记录记录的的过过程。程。对对信息的外表特征的描述,目前比信息的外表特征的描述,目前比较较成熟的是成熟的是:1 1)对对文文献献信息描述的信息描述的ISBDISBD模式。模式。这种这种模式已模式已获获得得国际国际上的上的认认可,可,它它主要采用主要采用统统一描述格式、一描述格式、统统一描述一描述内内容(包括描容(包括描述述项项目和描述目和描述单单元)和元)和统统一描述符一描述符号号(即(即标识标识符
18、符号号)的方)的方式,核心是式,核心是统统一描述一描述内内容,在此基容,在此基础础上上运运用用统统一描述符一描述符号号按按统统一描述格式一描述格式记录记录。2 2)另一)另一种种重要的信息描述模式是重要的信息描述模式是MARCMARC(Machine Machine Readable CatalogueReadable Catalogue)模式,)模式,这这是一是一种种在在ISBDISBD模式上利模式上利用用计计算机技算机技术术的新型的新型处处理格式,是一理格式,是一种国际种国际性的性的书书目目数数据据标标准交准交换换格式。格式。信息管理信息管理概论概论6.2.3 6.2.3 信息信息组织组织
19、的的内内容容 2.2.信息信息内内容特征的揭示容特征的揭示信息信息内内容特征的揭示是指容特征的揭示是指对对信息信息内内容特征容特征进进行深行深层层揭揭示示并转换并转换成成规规范化的范化的标识标识(包括分(包括分类号类号和主和主题词题词),),形成科形成科学学的的概概念念标识标识系系统统。它它需要利用一定的工具(信息需要利用一定的工具(信息组织语组织语言)或言)或规规范(范(标标引引规则规则)将将信息信息内内容特征容特征进进行行转换转换 。信息管理信息管理概论概论 6.2.3 6.2.3 信息信息组织组织的的内内容容 3.3.信息重信息重组组信息重信息重组组是在信息是在信息内内容特征分析的基容特
20、征分析的基础础上的具有上的具有创创造性的活造性的活动动,它它根据特定的目的和任根据特定的目的和任务务,对对有有关关的的大量信息大量信息进进行系行系统统性、性、综综合性的加工合性的加工处处理,形成新理,形成新的信息的的信息的过过程。程。其基本方法是,以一批相其基本方法是,以一批相关关信息信息为为基基础础,利用分析、,利用分析、鉴别鉴别、浓缩浓缩、提、提炼炼、综综合合归纳归纳和和评评价等手段,价等手段,对对信信息中的相息中的相关关各方面知各方面知识识点点进进行重行重组组,形成更加系,形成更加系统统的信息的信息产产品或知品或知识产识产品。品。信息管理信息管理概论概论6.2.3 6.2.3 信息信息组
21、织组织的的内内容容 4.4.信息存信息存储储信息存信息存储储是指在是指在对对信息的外部、信息的外部、内内容特征容特征进进行描行描述,且在确定述,且在确定标识标识之后按一定的之后按一定的规则规则和方法,把和方法,把所有的信息所有的信息记录组织记录组织成成为为一一个个有序的体系,以方有序的体系,以方便人便人们检们检索利用。索利用。信息管理信息管理概论概论6.3 6.3 分分类与类与主主题标题标引引分分类语类语言言与与分分类标类标引引主主题语题语言言与与主主题标题标引引 信息管理信息管理概论概论6.3.1 6.3.1 分分类语类语言言与与分分类标类标引引 分分类语类语言是分言是分类组织类组织法的法的
22、语语言基言基础础和依据,其具和依据,其具体表体表现现形式主要是分形式主要是分类类表。表。由于用分由于用分类类表和分表和分类规则来标类规则来标引、引、组织组织和和检检索文索文献献信息的方法被信息的方法被称为称为分分类类法,因此法,因此习惯习惯上人上人们将们将某某种种分分类语类语言又叫分言又叫分类类法。法。分分类类法的主要法的主要类类型有先型有先组组式分式分类类法和分面法和分面组组配式配式分分类类法,前者又被法,前者又被称为称为体系分体系分类类法或等法或等级级列列举举式式分分类类法,后者的典型代表是印度阮法,后者的典型代表是印度阮冈纳赞编冈纳赞编制的制的冒冒号号分分类类法法。信息管理信息管理概论概
23、论1.1.分分类类法的法的结构结构 类类目表目表 1)1)基本大基本大类类。2)2)简简表。表。3)3)详详表。表。4)4)复复分表。分表。分分类号类号,其其构构造方法可分造方法可分为为如下几如下几种种:1)1)层层累制:即分累制:即分类号类号的位的位数与类数与类目目级别级别基本上相基本上相对应对应,一,一位位号码号码表示一表示一级类级类目,目,两两位位号码号码表示二表示二级类级类目,依此目,依此类类推。推。2)2)顺顺序制:即分序制:即分类号类号是按是按类类目的先后目的先后顺顺序而不是等序而不是等级从级从小小到大安排。到大安排。3)3)混合制:即混合采用以上混合制:即混合采用以上两种两种方法
24、方法构构成分成分类号类号。类类目注目注释释和分和分类类法索引法索引 1)1)类类目注目注释释:是:是说说明明类类目的含目的含义义、范、范围围、使用、使用规则规则等事等事项项,以便正确理解和使用以便正确理解和使用该类该类目的文字。目的文字。2)2)分分类类法索引:是法索引:是为为了了帮帮助不熟悉助不熟悉类类目表目表逻辑逻辑体系的人,体系的人,从类从类名及其他相名及其他相关关名名称称字字顺顺途途径查径查找分找分类号类号的工具。的工具。6.3.1 6.3.1 分分类语类语言言与与分分类标类标引引信息管理信息管理概论概论国际专国际专利分利分类类法法美美国国生物生物学学文摘文摘6.3.1 6.3.1 分
25、分类语类语言言与与分分类标类标引引 信息管理信息管理概论概论6.3.1 6.3.1 分分类语类语言言与与分分类标类标引引 2.2.分分类类法用于信息法用于信息组织组织的使用方式的使用方式(1)(1)分分类编类编排手工排手工检检索工具的正文(主体)部分,索工具的正文(主体)部分,具体具体来说来说,这种这种使用方式有使用方式有两种两种情情况况:编编排分排分类类目目录录。用于用于编编排文摘型或排文摘型或题录题录型型检检索刊物的正文(文摘、索刊物的正文(文摘、题录题录)部分。)部分。(2)(2)用于用于编编排排检检索工具的分索工具的分类类索引。索引。(3)(3)用于用于构构成成计计算机算机检检索索数数
26、据据库库信息信息记录记录的分的分类号类号字字段。段。信息管理信息管理概论概论美美国国化化学学文摘文摘英英国国科科学学文摘文摘美美国国生物生物学学文摘文摘6.3.1 6.3.1 分分类语类语言言与与分分类标类标引引信息管理信息管理概论概论6.3.1 6.3.1 分分类语类语言言与与分分类标类标引引3.3.分分类组织类组织法的法的实实施保施保证证分分类标类标引引规则规则(1)(1)基本基本标标引引规则规则 (2)(2)(2)(2)各各种种主主题题形式的信息的分形式的信息的分类标类标引引规则规则 信息管理信息管理概论概论6.3.2 6.3.2 主主题语题语言言与与主主题标题标引引 主主题语题语言是信
27、息的主言是信息的主题组织题组织法的法的语语言基言基础础,是以信息的,是以信息的主主题为题为依据,用依据,用语词语词作作为概为概念念标识标识,将概将概念念标识标识按字按字顺顺组织组织排列,排列,并并用用参参照系照系统间统间接接显显示示概概念之念之间间的相互的相互关关系系的一的一种检种检索索语语言。言。主主题语题语言包括言包括标题词语标题词语言、言、单单元元词语词语言、言、叙词语叙词语言和言和关关键词语键词语言,其中言,其中叙词语叙词语言是言是较为规较为规范和使用范和使用较较广泛的信广泛的信息息组织语组织语言,因此言,因此这这里以里以它为它为例例进进行介行介绍绍:1 1叙词语叙词语言的言的构构成原
28、理成原理 2 2叙词语叙词语言的具体体言的具体体现现叙词叙词表表 3.3.用于信息用于信息组织组织的使用方式的使用方式 4.4.主主题组织题组织法的法的实实施保施保证证主主题标题标引引规则规则 信息管理信息管理概论概论 6.3.2 6.3.2 主主题语题语言言与与主主题标题标引引 1 1叙词语叙词语言的言的构构成原理成原理 就其性就其性质质而言,而言,叙词语叙词语言是一言是一种种采用表示采用表示单单元元概概念的念的规规范化范化语词语词的的组组配配来对来对信息主信息主题进题进行描述的后行描述的后组组式式词汇词汇型型标识标识系系统统。(1 1)它它采用了采用了组组配分配分类类法的法的概概念念组组配
29、,配,并并适适当当采用了采用了标题标题法法的的概概念念预预先先组组配的方法,克服了某些配的方法,克服了某些词词分拆后再分拆后再组组配配时产时产生意生意义义失失真真的缺点。的缺点。(2 2)它它采用了采用了标题标题法法对语词进对语词进行行严严格格规规范化的方法,以保范化的方法,以保证证词词和和概概念的一一念的一一对应对应。(3 3)它它采用采用并并完善了完善了标题标题法的法的参参照系照系统统,采用了分,采用了分类类法的基法的基本原理本原理编编制制叙词叙词分分类类索引和等索引和等级级索引,采用了索引,采用了与关键词与关键词法法类类似的方法似的方法编编制制叙词轮叙词轮排索引,排索引,从从多方面多方面
30、显显示示叙词间叙词间的相的相互互关关系,以保系,以保证证准确、全面地准确、全面地选选用用叙词进叙词进行行标标引和引和检检索。索。信息管理信息管理概论概论 6.3.2 6.3.2 主主题语题语言言与与主主题标题标引引 2 2叙词语叙词语言的具体体言的具体体现现叙词叙词表表 叙词叙词表有以下几表有以下几个组个组成部分:成部分:主表主表附表附表辅辅助索引:助索引:1 1)词词族索引。又族索引。又称为称为等等级级索引或族系索引。索引或族系索引。它它是是将将主表中具有主表中具有属种关属种关系、整体系、整体与与部分部分关关系、包含系、包含与与被包含被包含关关系的正式主系的正式主题词题词,按其本,按其本质属
31、质属性性展展开开,显显示示词间从属关词间从属关系的一系的一种词种词族系族系统统。2 2)范)范畴畴索引。又索引。又称称范范畴畴表或分表或分类类索引。索引。它它是把是把叙词叙词表的全部表的全部叙词叙词按其按其所所属学属学科范科范畴归结畴归结在相在相应应的的类类下,同一下,同一类类中的中的叙词叙词按字按字顺顺排列。排列。3 3)轮轮排索引。又排索引。又称轮称轮排表,排表,它它是把主表中全部是把主表中全部词组词组按其所含按其所含词词素的字素的字顺顺排列,使含有同一排列,使含有同一词词素的素的词组词组集中于一集中于一处处的的叙词叙词索引,索引,它它方便方便查词查词者者从从一一个词组个词组的各的各个个部
32、分部分进进行行查查找。找。4 4)双语种对双语种对照索引。是把主表中的照索引。是把主表中的词与词与其外其外语译语译名相名相对应对应,提供,提供从从外外语词语词字字顺查顺查找主表找主表叙词叙词的一的一种种索引。索引。信息管理信息管理概论概论 6.3.2 6.3.2 主主题语题语言言与与主主题标题标引引 3.3.用于信息用于信息组织组织的使用方式的使用方式 (1 1)在)在计计算机算机检检索的索的数数据据库记录库记录中中构构成主成主题题字段,提供主要字段,提供主要检检索途索途径径。(2 2)构构成主成主题标识题标识,组织组织文文献献主主题题目目录录。(3 3)用于)用于编编排排检检索工具的正文,索
33、工具的正文,这种这种使用方式不多使用方式不多见见。(4 4)用于)用于编编排排检检索工具的索工具的辅辅助主助主题题索引。具体包括:索引。具体包括:单个叙词单个叙词(单词单词或或词组词组)后直接)后直接标标出一出一个个或多或多个个文摘文摘号号。单个叙词单个叙词(单词单词或或词组词组)下配有)下配有说说明明语语(主要是(主要是来来自文自文献献题题名中的名中的词词)或直接列出)或直接列出题题名,然后名,然后标标出文摘出文摘号号。多多个叙词组个叙词组成主成主题标识题标识,表,表达达文文献献主主题题,之后,之后标标出文摘出文摘号号。信息管理信息管理概论概论 6.3.2 6.3.2 主主题语题语言言与与主
34、主题标题标引引4.4.主主题组织题组织法的法的实实施保施保证证主主题标题标引引规则规则主主题标题标引引规则规则分分为为一般一般标标引引规则规则、不同文、不同文献献信息的特殊信息的特殊标标引引规则规则和和单单位具体位具体标标引引细则细则。依据我依据我国国汉语汉语主主题标题标引工作引工作细则细则(19981998年修年修订订本)和本)和国国家家标标准准文文献献主主题标题标引引规则规则对对主主题标题标引的引的规规定如下:定如下:(1 1)标标引引词词的的书写规则书写规则(2 2)标标引深度引深度规则规则(3 3)标标引引词选词选取的取的专专指性指性规则规则(4 4)单单主主题题文文献献信息信息标标引
35、引规则规则(5 5)多主)多主题题信息信息标标引引规则规则(6 6)一般信息的主)一般信息的主题标题标引引规则规则(7 7)特殊信息主)特殊信息主题标题标引引 信息管理信息管理概论概论 6.4 6.4 元元数数据据元元数数据的据的概概念、念、类类型型与与特征特征网络网络信息信息组织组织中的元中的元数数据及据及 元元数数据的据的应应用用元元数数据的据的发发展展信息管理信息管理概论概论对对象元象元数数据据 元元数数据据模模块块信息管理信息管理概论概论6.4.1 6.4.1 元元数数据据的的概概念、念、类类型型与与特征特征1.1.元元数数据的据的概概念念元元数数据是描述和限定其他据是描述和限定其他数
36、数据的据的数数据据.其典型事例有:用于描述其典型事例有:用于描述数数据的重要特征(如据的重要特征(如创创作者的名作者的名称称、出版年)、用于出版年)、用于数数据定位的据定位的数数据(如据(如图书馆图书图书馆图书的杜威分的杜威分类号类号、电视节电视节目目频频道)以及有助于道)以及有助于数数据据检检索的索的数数据(如据(如数数据的自由文本描述或据的自由文本描述或数数据的摘要,或者一系列适用于一系据的摘要,或者一系列适用于一系列列数数据的可据的可检检索的主索的主题关键词题关键词)关关于元于元数数据,迄今据,迄今为为止,止,还没还没有完全有完全统统一的定一的定义义,最,最简洁简洁的的定定义义是:元是:
37、元数数据是据是关关于于数数据的据的数数据(据(data about datadata about data)。)。其中前一其中前一个个“数数据据”代表的是代表的是“资资源源”,后一,后一个则对应个则对应着元着元数数据。据。信息管理信息管理概论概论 6.4.1 6.4.1 元元数数据的据的概概念、念、类类型型与与特征特征为为了正确了正确认识认识和使用元和使用元数数据,有必要据,有必要对对其其概概念和范念和范围围有一有一个个清清楚的楚的认识认识。在。在关关于元于元数数据的据的许许多定多定义义的表述的表述内内容中,其中容中,其中比比较较重要的几点重要的几点内内容有:容有:1 1)元)元数数据最据最简
38、洁简洁定定义义中的中的“数数据据”一般指的是表示事物性一般指的是表示事物性质质的符的符号号,是,是进进行各行各种统计种统计、计计算、科算、科学研学研究、技究、技术设计术设计所依所依据的据的数值数值。2 2)元)元数数据形式多据形式多样样,不一定是,不一定是数数字形式的。字形式的。3 3)元)元数数据不只是据不只是对对信息信息对对象的描述,在象的描述,在对对博物博物馆馆、档档案案馆馆、图书馆图书馆的的数数据据进进行描述或行描述或编编目的同目的同时时,还还能能够说够说明被描述明被描述资资源的使用源的使用环环境、管理、加工、保存和使用等方面的情境、管理、加工、保存和使用等方面的情况况。4 4)元)元
39、数数据可以据可以来来自各自各种种不同的不同的资资源,元源,元数数据可以由人据可以由人类类(编编制者、信息制者、信息专专家或使用者)提供,家或使用者)提供,还还可以由可以由计计算机自算机自动动生成,或者通生成,或者通过过一一项资项资源源与与另一另一项资项资源的源的关关系系来来推推断断,如超,如超链链接。接。信息管理信息管理概论概论6.4.1 6.4.1 元元数数据的据的概概念、念、类类型型与与特征特征 2.2.元元数数据的据的类类型及其型及其应应用范用范围围管理型元管理型元数数据:在管理信息据:在管理信息资资源中利用的元源中利用的元数数据。据。描述型元描述型元数数据:用据:用来来描述或描述或识别
40、识别信息信息资资源的的元源的的元数数据。据。保存型元保存型元数数据:据:与与信息信息资资源的保存管理相源的保存管理相关关的信息。的信息。技技术术型元型元数数据:据:与与系系统统如何行使如何行使职责职责或元或元数数据如何据如何发挥发挥作用相作用相关关的元的元数数据。据。使用型元使用型元数数据:据:与与信息信息资资源利用的等源利用的等级级和和类类型相型相关关的元的元数数据。据。信息管理信息管理概论概论6.4.1 6.4.1 元元数数据的据的概概念、念、类类型型与与特征特征3.3.元元数数据的据的属属性性与与特征特征 一般一般认为认为,元元数数据的据的来来源主要有源主要有两两部分:部分:来来自信息自
41、信息对对象象内内部,是由信息部,是由信息对对象的制作部象的制作部门门首次生成首次生成该该对对象或其象或其数数字化字化时编时编制;制;来来自自与与信息信息对对象相象相关关的信息的信息对对象外部,象外部,它它是后是后来来生成的,生成的,往往由其他人而不是信息往往由其他人而不是信息对对象的原象的原来来制作者制作者编编制。制。元元数数据的生成方式也有据的生成方式也有两种两种:由由计计算机自算机自动动生成的元生成的元数数据;据;由人工由人工编编制的元制的元数数据。据。信息管理信息管理概论概论6.4.1 6.4.1 元元数数据的据的概概念、念、类类型型与与特征特征 3.3.元元数数据的据的属属性性与与特征
42、特征元元数数据的据的状态状态:稳稳定的元定的元数数据,一旦生成就永据,一旦生成就永远远不不变变;动态动态的元的元数数据,可能据,可能会随会随着信息着信息对对象的使用或操作而改象的使用或操作而改变变。长长期期使用的元使用的元数数据,用于保据,用于保证证信息信息对对象的持象的持续续存取和使用;短期存取和使用;短期的元的元数数据,主要是用于据,主要是用于处处理的理的数数据。据。元元数数据的据的结构结构:结构结构化的元化的元数数据,符合可据,符合可预预言的言的标标准化的或准化的或非非标标准化的准化的结构结构;非;非结构结构化的元化的元数数据,不符合可据,不符合可预预言的言的结构结构。元元数数据的据的语
43、义语义:控制的元:控制的元数数据,符合据,符合标标准化的准化的词汇词汇或或规规范格范格式;非控制的元式;非控制的元数数据,不符合任何据,不符合任何标标准化的准化的词汇词汇或或规规范格式。范格式。元元数数据的据的层层次:次:馆馆藏元藏元数数据,据,与与信息信息对对象的集合相象的集合相关关;文;文献献元元数数据,据,与单个与单个的信息的信息对对象相象相关关,通常被包含在,通常被包含在馆馆藏中。藏中。信息管理信息管理概论概论6.4.2 6.4.2 网络网络信息信息组织组织中的元中的元数数据据 及元及元数数据的据的应应用用 1.1.元元数数据的据的应应用目的用目的确确认认和和检检索(索(Discove
44、ry identificationDiscovery identification),),著著录录描述(描述(CatalogingCataloging资资源管理(源管理(Resource Administration)Resource Administration)资资源保源保护与长护与长期保存(期保存(Preservation and Preservation and Archiving)Archiving)信息管理信息管理概论概论6.4.2 6.4.2 网络网络信息信息组织组织中的元中的元数数据据 及元及元数数据的据的应应用用2.2.元元数数据的建立据的建立为为信息包生成元信息包生成元数数
45、据的据的过过程包括程包括3 3个个部分:部分:编码编码、提供、提供对对信息包的描述以及信息包的管理和保存所必需信息包的描述以及信息包的管理和保存所必需的其他信息。利用元的其他信息。利用元数数据据组织组织因特因特网网上信息上信息内内容的活容的活动动正正在在扩扩展。在展。在创创作作阶阶段,段,当当作者作者将将元元数数据嵌入使用据嵌入使用HTML HTML METAMETA标识标识符、符、SGMLSGML标题标题和和/或其他元或其他元数数据的模板据的模板时时,就,就可以生成元可以生成元数数据。据。它它也可以由搜索引擎生成。例如,摘要也可以由搜索引擎生成。例如,摘要对对象交象交换换格式格式(Summa
46、ry Object Interchange FormatSummary Object Interchange Format,SOIFSOIF)的元)的元数数据是由收据是由收获获程序生成的。程序生成的。还还可以在服可以在服务阶务阶段形成的元段形成的元数数据,元据,元数数据被定位在一据被定位在一个个有指有指示器指向示器指向它它所描述的所描述的资资源的集中或分散式源的集中或分散式数数据据库库中。中。信息管理信息管理概论概论6.4.2 6.4.2 网络网络信息信息组织组织中的元中的元数数据据 及元及元数数据的据的应应用用 3 3元元数数据的据的结构结构 (1)(1)总总体体结构结构定定义义方式方式 一
47、一个个MetadataMetadata格式由多格式由多层层次的次的结构结构予以定予以定义义:内内容容结构结构(Content structureContent structure),),对该对该MetadataMetadata的的构构成元素及其定成元素及其定义标义标准准进进行描述。行描述。句法句法结构结构(Syntax structureSyntax structure),定),定义义MetadataMetadata结构结构以及如何描述以及如何描述这种结构这种结构。语义结构语义结构(Semantic structureSemantic structure),定),定义义MetadataMeta
48、data元素的具体描述方法。元素的具体描述方法。(2)(2)内内容容结构结构内内容容结构结构定定义义MetadataMetadata的的构构成元素,包括:描述性元素、技成元素,包括:描述性元素、技术术性元素、管理性性元素、管理性元素、元素、结构结构性元素。性元素。(3)(3)句法句法结构结构句法句法结构结构定定义义格式格式结构结构及其描述方式,例如元素的分及其描述方式,例如元素的分区区分段管理、元素分段管理、元素选选取使取使用用规则规则、元素描述方法(例如、元素描述方法(例如Dublin CoreDublin Core采用采用ISO/IEC11179ISO/IEC11179标标准)、元素准)、
49、元素结结构构描述方法(例如描述方法(例如MARCMARC记录结构记录结构、SGMLSGML结构结构、XMLXML结构结构)、机)、机构语构语句描述句描述语语言(例如言(例如EBNF NotationEBNF Notation)等。)等。(4)(4)语义结构语义结构语义结构语义结构定定义义元素的具体描述方法,例如:描述元素元素的具体描述方法,例如:描述元素时时所采用的所采用的标标准、最佳准、最佳实实践践(Best PracticesBest Practices)或自定)或自定义义的描述要求(的描述要求(InstructionsInstructions)。)。信息管理信息管理概论概论6.4.2 6
50、.4.2 网络网络信息信息组织组织中的元中的元数数据据 及元及元数数据的据的应应用用4.4.元元数数据的据的编码语编码语言言与与制作方式制作方式 (1)(1)元元数数据据编码语编码语言(言(Metadata Encoding Metadata Encoding LanguagesLanguages)指)指对对元元数数据元素和据元素和结构进结构进行定行定义义和描和描述的具体述的具体语语法和法和语义规则语义规则,常,常称为称为定定义义描述描述语语言言(DDLDDL)。)。(2)(2)元元数数据制作方式据制作方式专门编专门编制模制模块块(例如(例如对对MARCMARC、GILSGILS、FGDCFG