《信息存储与检索教材课件汇总完整版ppt全套课件最全教学教程整本书电子教案全书教案课件合集.ppt》由会员分享,可在线阅读,更多相关《信息存储与检索教材课件汇总完整版ppt全套课件最全教学教程整本书电子教案全书教案课件合集.ppt(277页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、信息存储与检索 基础理论部分基础理论部分第第1 1章章 信息资源概论信息资源概论 第第2 2章章 信息存储与检索基础信息存储与检索基础 第第3 3章章 信息存取技术与信息检索信息存取技术与信息检索方法方法 第第4 4章章 计算机信息存取系统计算机信息存取系统应用部分应用部分第第5 5章章 联机存取系统联机存取系统第第6 6章章 InternetInternet存取系统存取系统第第7 7章章 文本信息存取文本信息存取第第8 8章章 多媒体信息存取系统多媒体信息存取系统 第第9 9章章 事实和数据信息存取事实和数据信息存取第第1010章章 国外著名信息存取系统国外著名信息存取系统第第11 11章章
2、 中国著名信息存取系统中国著名信息存取系统第第1章章 信息资源概论信息资源概论 信息资源信息资源 电子信息资源电子信息资源 纸质文献资源纸质文献资源 1.1 信息资源信息资源1.1.1 信息资源的基本概念信息资源的基本概念 信息的涵义:信息的涵义:信息是生物以及具有自动控制系统的信息是生物以及具有自动控制系统的机器通过感觉器官或者细胞组织,或者具有类似功能的机器通过感觉器官或者细胞组织,或者具有类似功能的设备部件与外界进行交流的一切内容。设备部件与外界进行交流的一切内容。资源的涵义:资源的涵义:资源是一切可被人类开发和利用的客资源是一切可被人类开发和利用的客观存在。观存在。信息资源的涵义:信息
3、资源的涵义:信息资源是经过人类主观或客信息资源是经过人类主观或客观处理了的,并且能够被传播或传输的文字、声音、图观处理了的,并且能够被传播或传输的文字、声音、图像像、数据。数据。1.1.2 信息资源的基本特征信息资源的基本特征 共享性共享性 时效性时效性 智能性智能性 无限性与有限性并存无限性与有限性并存 增值性增值性 1.1.3 信息资源的类型信息资源的类型 纸质文献型信息资源纸质文献型信息资源 电子型信息资源(包括电子出版物和电子型信息资源(包括电子出版物和网络信息资源)网络信息资源)下一节 1.2.1 电子信息资源的含义、特点及不电子信息资源的含义、特点及不足:足:含义:含义:电子信息资
4、源书是以数字化电子信息资源书是以数字化 形式形式(即二进制代码(即二进制代码0、1),把文字、图像、声音动画),把文字、图像、声音动画等多种形式的信息存储在光、磁等非印刷型介质上,等多种形式的信息存储在光、磁等非印刷型介质上,以光信号、电信号的形式传输,并通过相应的计算以光信号、电信号的形式传输,并通过相应的计算机和其他外部设备再现出来的信息资源。机和其他外部设备再现出来的信息资源。1.2 电子信息资源电子信息资源 特点特点 存储形式多样化:文本、超文存储形式多样化:文本、超文 本、多媒本、多媒 体、超媒体等体、超媒体等 资源数字化:以二进制代码形式存在资源数字化:以二进制代码形式存在 可交流
5、程度高:信息交流范围扩大、信息交流能动性增强、可交流程度高:信息交流范围扩大、信息交流能动性增强、信息交流对象增多信息交流对象增多 方便利用:易获取、易检索、易保存方便利用:易获取、易检索、易保存 内容丰富:集图、文、声像、动画于一体内容丰富:集图、文、声像、动画于一体 载体容量大:存储载体信息密度高、容量大载体容量大:存储载体信息密度高、容量大 电子信息资源的不足:电子信息资源的不足:对阅读设备的依赖性对阅读设备的依赖性 阅读舒适度差阅读舒适度差 需具备计算机基础知识需具备计算机基础知识1.2.2 电子信息资源的类型电子信息资源的类型 按网络传输协议的不同分按网络传输协议的不同分:Web信息
6、资源:通过信息资源:通过HTTP在网上传输。在网上传输。Telnet信息资源:基于网络通讯协议。信息资源:基于网络通讯协议。FTP信息资源:通过信息资源:通过FTP协议可完成完整的文件拷贝。协议可完成完整的文件拷贝。用户服务组信息资源:由一组对某一特定主题有共同兴用户服务组信息资源:由一组对某一特定主题有共同兴趣的网络用户组成的电子论坛。趣的网络用户组成的电子论坛。GopherGopher信息资源:信息资源:GopherGopher是一种基于菜单的网络服务,是一种基于菜单的网络服务,允许用户以一种简单的、一致的方式快速找到并访问所需的网络资允许用户以一种简单的、一致的方式快速找到并访问所需的网
7、络资源。源。按存取方式不同分:按存取方式不同分:邮件型信息资源邮件型信息资源 电话型信息资源电话型信息资源 揭示版型信息资源揭示版型信息资源 广播型信息资源广播型信息资源 图书馆型信息资源图书馆型信息资源 书目型信息资源书目型信息资源 交互型信息资源交互型信息资源 按信息传播于交流过程分:按信息传播于交流过程分:稳定的电子信息资源稳定的电子信息资源 不稳定的电子信息资源不稳定的电子信息资源 按目前常用的网络搜索引擎分(以按目前常用的网络搜索引擎分(以yahoo为例),为例),如图:如图:可分为艺术与人文、商业与经济、教育、娱乐、可分为艺术与人文、商业与经济、教育、娱乐、政府、新闻与媒体等政府、
8、新闻与媒体等14类。类。请点击 yahoo分类的不足:知识体系不完整、等级关分类的不足:知识体系不完整、等级关 系不清;系不清;知识体系不严密;无类目标记号;层次设置深浅知识体系不严密;无类目标记号;层次设置深浅不等。不等。按正式出版物类型的不同分:按正式出版物类型的不同分:电子图书电子图书 电子期刊电子期刊 电子报纸电子报纸 下一节1.3 纸质文献资源纸质文献资源 1.3.1 纸质文献资源的性质、特点及来源:纸质文献资源的性质、特点及来源:性质:性质:纸质文献是知识的存在形式纸质文献是知识的存在形式 传递信息知识传递信息知识 纸质文献资源可以多次重复使用纸质文献资源可以多次重复使用 纸质文献
9、所载的是相对固化的信息纸质文献所载的是相对固化的信息 特点:特点:携带、书写、保存方便携带、书写、保存方便 直观性直观性 以纸质为载体的艺术作品的不可替代性以纸质为载体的艺术作品的不可替代性 纸质文献作为收藏怕的不可替代性纸质文献作为收藏怕的不可替代性 来源来源 个人个人 出版社出版社 教育科研机构教育科研机构 公司企业公司企业 学术团体学术团体 政府部门及各类社会组织政府部门及各类社会组织 文献信息部门文献信息部门 1.3.2 纸质文献资源的类型与情报价值纸质文献资源的类型与情报价值 按文献编撰方法和出版特点分:按文献编撰方法和出版特点分:图书及其情报价值图书及其情报价值 期刊及其情报价值期
10、刊及其情报价值 报纸及其情报价值报纸及其情报价值 会议文献及其情报价值会议文献及其情报价值 科技报告及其情报价值科技报告及其情报价值 标准文献及其情报价值标准文献及其情报价值 专利文献及其情报价值专利文献及其情报价值 学位论文及其情报价值学位论文及其情报价值 产品说明书及其情报价值产品说明书及其情报价值 按文献加工深度分:按文献加工深度分:一次文献及其情报价值:作者最初发表的原始文献,如专著、一次文献及其情报价值:作者最初发表的原始文献,如专著、论文、译文等。论文、译文等。二次文献及其情报价值:对一次文献加工整理后的产物,如二次文献及其情报价值:对一次文献加工整理后的产物,如书目、文摘、索引等
11、。书目、文摘、索引等。三次文献及其情报价值:在一、二次文献基础上加工出来的三次文献及其情报价值:在一、二次文献基础上加工出来的文献,如综述、述评等。文献,如综述、述评等。零次文献及其情报价值:尚未系统整理的零散资料,如草稿、零次文献及其情报价值:尚未系统整理的零散资料,如草稿、记录、谈话等。记录、谈话等。本章结束本章结束返回第第2章章 信息存储与检索基础信息存储与检索基础 信息存储与检索原理信息存储与检索原理 信息存取发展与类型信息存取发展与类型 索引的结构与类型索引的结构与类型 2.1 信息存储与检索原理信息存储与检索原理2.1.1 社会发展与信息需求社会发展与信息需求 从学术研究到社会生活
12、全方位信息需求从学术研究到社会生活全方位信息需求 从文字资料到声音与活动画面的信息需求从文字资料到声音与活动画面的信息需求 从完备信息趋向对即时信息的需求从完备信息趋向对即时信息的需求 从注重信息载体物理性质到注重信息本身从注重信息载体物理性质到注重信息本身 从馆藏需求到国际互联网络共享从馆藏需求到国际互联网络共享 从传统的手工信息检索到从传统的手工信息检索到Internet引擎引擎查检2.1.2 信息存储与检索原理信息存储与检索原理 信息存储与检索(信息存储与检索(Information Storage and Retrieval)是信是信息息检索的全称形式或广义的信息检索,它既包括采用多种
13、形检索的全称形式或广义的信息检索,它既包括采用多种形式记录信息、排序信息的信息存储过程,也包括通过一定的式记录信息、排序信息的信息存储过程,也包括通过一定的设备、采用一定的手段与技巧从信息系统中快速、准确地搜设备、采用一定的手段与技巧从信息系统中快速、准确地搜寻所需信息的方法与过程。寻所需信息的方法与过程。信息存储与检索的基本原理信息存储与检索的基本原理就是,查询语言(检索提问)就是,查询语言(检索提问)和系统标识语言所进行的和系统标识语言所进行的“相符性比较相符性比较”与与“匹配运算匹配运算”。信息存储与检索走过了文献检索、情报检索的过程,正向知信息存储与检索走过了文献检索、情报检索的过程,
14、正向知识检索的领域迈进。识检索的领域迈进。信息检索通常包括信息检索通常包括4种类型,种类型,一是关于文献的检索;二是关于一是关于文献的检索;二是关于某事实或事项的知识检索;三是关于数值或数据的情报检索;某事实或事项的知识检索;三是关于数值或数据的情报检索;四是关于图象信息的信息检索。四是关于图象信息的信息检索。信息存储与信息检索关系图信息存储与信息检索关系图 系系统统标标识识语语言言形形式式概概念念检检索索提提问问M形形式式概概念念信信息息资资源源M信息集合信息集合MABCDM检索检索系统系统答复答复M 信息存储信息存储 信息检索信息检索主题主题分析分析转换成转换成索引标识索引标识转换成转换成
15、系统标识系统标识课题课题分析分析2.1.3 信息检索相关学科信息检索相关学科 作为一门学科的信息检索作为一门学科的信息检索 现代信息检索是以计算机科学与技术、网络技术、现代信息检索是以计算机科学与技术、网络技术、光盘技术、通信技术等现代信息技术在信息存储光盘技术、通信技术等现代信息技术在信息存储与检索中的应用为基础,全面探讨适应现代信息与检索中的应用为基础,全面探讨适应现代信息处理的信息描述、信息存储、信息检索和信息提处理的信息描述、信息存储、信息检索和信息提供之理论、技术与方法的应用性学科。供之理论、技术与方法的应用性学科。信息检索的相关学科信息检索的相关学科 信息检索是一门交叉学科,其相关
16、学科涉及到信信息检索是一门交叉学科,其相关学科涉及到信息管理科学、计算机科学、数学、系统论和语言息管理科学、计算机科学、数学、系统论和语言学等多个学科领域。学等多个学科领域。2.1.4信息检索研究信息检索研究信息检索是一门发展中的学科,目前国内信息检索是一门发展中的学科,目前国内外正从不同的角度展开全面的研究:外正从不同的角度展开全面的研究:信息检索理论与技术研究信息检索理论与技术研究信息存取系统研究信息存取系统研究数据库标准与建设数据库标准与建设研究研究信息存取的语言处理信息存取的语言处理现代信息检索工具比较研究现代信息检索工具比较研究检索策略研究检索策略研究2.2 信息存取发展与类型信息存
17、取发展与类型 信息检索存取发展信息检索存取发展 早期书目检索工具的编制早期书目检索工具的编制 科技检索刊物体系的形成科技检索刊物体系的形成 计算机检索的发展计算机检索的发展 计算机信息检索的计算机信息检索的4个发展阶段:个发展阶段:单机批处理时期单机批处理时期 联机检索试用阶段联机检索试用阶段 联机服务市场化与光盘检索的兴起联机服务市场化与光盘检索的兴起 全球信息检索多媒体联网时期全球信息检索多媒体联网时期 我国计算机信息检索的发展过程:我国计算机信息检索的发展过程:引进开发国外磁带、开展定题服务(引进开发国外磁带、开展定题服务(SDI)开发国际联机检索终端开发国际联机检索终端 自建数据库自建
18、数据库 微型计算机和国际联机网信息存取的发展微型计算机和国际联机网信息存取的发展2.2.2 信息存储与检索类型信息存储与检索类型 广义的信息检索包括信息存储与查检两个部分。广义的信息检索包括信息存储与查检两个部分。狭义的信息检索有许多类型,从不同角度可划分为:狭义的信息检索有许多类型,从不同角度可划分为:按检索活动的执行主体划分按检索活动的执行主体划分 手工检索(手工检索(Manual Retrieval)计算机检索计算机检索(Computer Retrieval)按查询信息的特征划分按查询信息的特征划分 书目检索(书目检索(Bibliographic Retrieval)数据检索数据检索(D
19、ata Retrieval)事实检索事实检索 (Fact Retrieval)全文检索全文检索 (Full Text Retrieval)图象检索图象检索(Image Retrieval)多媒体信息检索多媒体信息检索 (Multimedia Data Retrieval)2.2.2 信息存储与检索类型信息存储与检索类型按检索系统的工作方式划分按检索系统的工作方式划分 脱机检索(脱机检索(Off-line Retrieval)联机检索(联机检索(On-line Retrieval)光盘检索(光盘检索(CD-ROM Retrieval)国际互联网络检索(国际互联网络检索(Internet Retr
20、ieval)按检索策略划分按检索策略划分 布尔逻辑检索(布尔逻辑检索(Logical Retrieval)截词检索(截词检索(Truncation Retrieval)位置逻辑检索(位置逻辑检索(Proximate Operator Retrieval)限定检索(限定检索(Range Retrieval)加权检索(加权检索(Weighting Retrieval)2.2.2 信息存储与检索类型信息存储与检索类型按系统载体划分按系统载体划分 印刷型文本系统检索(印刷型文本系统检索(Printed Text Retrieval)缩微磁带检索(缩微磁带检索(Microfilm Retrieval)光
21、盘系统检索(光盘系统检索(CD-ROM Retrieval)计算机存取系统查询(计算机存取系统查询(Computer-based Retrieval)按检索工具类型划分按检索工具类型划分 目录与题录检索(目录与题录检索(Catalog and Title Searching)文摘检索(文摘检索(Abstract Searching)索引检索(索引检索(Index Searching)字典型检索(字典型检索(Dictionary Searching)交互式检索(交互式检索(Alternately Searching)2.3 索引的结构与类型索引的结构与类型索引索引(Index)就是将信息集合中具
22、有检索意义的事物名称及特征就是将信息集合中具有检索意义的事物名称及特征(如篇名、人名、书名、刊名、网页、网站、地名、分类号、主(如篇名、人名、书名、刊名、网页、网站、地名、分类号、主题词、分子式、专利号、报告号、名词术语等)抽取出来,著明题词、分子式、专利号、报告号、名词术语等)抽取出来,著明其地址,按照字顺或逻辑分类等次序组织款目,从而为用户提供其地址,按照字顺或逻辑分类等次序组织款目,从而为用户提供查询线索的检索工具。查询线索的检索工具。索引的款目结构:索引的款目结构:索引标题词索引标题词 索引标题词亦称标目、索引键、索引标题等。它一般处于索引款索引标题词亦称标目、索引键、索引标题等。它一
23、般处于索引款目最醒目的位置,是索引款目的核心,它决定着一条索引款目在目最醒目的位置,是索引款目的核心,它决定着一条索引款目在整个索引中的排列位置,是索引款目的检索入口。索引标题词可整个索引中的排列位置,是索引款目的检索入口。索引标题词可以为单一标题词,也可以为带有副标题的多级标题词。以为单一标题词,也可以为带有副标题的多级标题词。2.3.1 索引的款目结构索引的款目结构 说明语说明语 也称为上下文或修饰语,通常位于索引标题词的右边也称为上下文或修饰语,通常位于索引标题词的右边或下面,用来说明、解释、限定索引标题词含义的辅助项目。或下面,用来说明、解释、限定索引标题词含义的辅助项目。地址参考项地
24、址参考项 地址参考项位于索引标题词和说明语之后,索引地址地址参考项位于索引标题词和说明语之后,索引地址所指明的是索引标题词所在的页码或在检索系统中的文献顺序号、所指明的是索引标题词所在的页码或在检索系统中的文献顺序号、分类号或文献号等,即索引标题词的出处。索引参考项有时用于分类号或文献号等,即索引标题词的出处。索引参考项有时用于引导用户使用正式索引标题词。引导用户使用正式索引标题词。例例1:Methane,use in methanol manufacture,3241甲烷,甲烷,用于甲烷制备,用于甲烷制备,3241说明:说明:索引标题词,索引标题词,说明语,说明语,文献号(地址参考项)文献号
25、(地址参考项)2.3.2 主要索引类型主要索引类型索引系统索引系统从形式上讲是成千上万件索引款目的集合,从内容上看从形式上讲是成千上万件索引款目的集合,从内容上看是信息单元的指南。索引系统的排序是按照索引标题的顺序组织是信息单元的指南。索引系统的排序是按照索引标题的顺序组织而成,不同性质的索引标题词构成了不同类型的索引。而成,不同性质的索引标题词构成了不同类型的索引。依据索引标题词的性质划分:依据索引标题词的性质划分:有揭示信息资源内容特征的主有揭示信息资源内容特征的主题索引、分类索引、关键词索引、分子式索引、结构式索引;有题索引、分类索引、关键词索引、分子式索引、结构式索引;有揭示信息资源形
26、式特征的题名索引、人名索引、物名索引、代码揭示信息资源形式特征的题名索引、人名索引、物名索引、代码索引、引文索引。索引、引文索引。依据索引标题词的排序方式划分:依据索引标题词的排序方式划分:有按照标题词字顺组织的有按照标题词字顺组织的主题索引、题名索引、人名索引、关键词索引、语词索引等;有主题索引、题名索引、人名索引、关键词索引、语词索引等;有按照文献代码组织的报告号索引、合同号索引、标准号索引等;按照文献代码组织的报告号索引、合同号索引、标准号索引等;有按其它排序方式组织的网络信息自动索引、重量索引、速度索有按其它排序方式组织的网络信息自动索引、重量索引、速度索引、专用索引等。引、专用索引等
27、。按照检索方式划分:按照检索方式划分:有先组式索引和后组式索引。有先组式索引和后组式索引。按照索引所包括的对象划分:按照索引所包括的对象划分:有综合索引和专门索引。有综合索引和专门索引。2.3.2 主要索引类型主要索引类型以下简述几种常用索引的特点:以下简述几种常用索引的特点:题名索引题名索引(Title Index)题名索引,是将信息资源的题名特征(书名、刊名、篇名)选作题名索引,是将信息资源的题名特征(书名、刊名、篇名)选作为索引标题词所编制的索引系统。题名索引常采用字顺排序法组为索引标题词所编制的索引系统。题名索引常采用字顺排序法组织款目。织款目。例如:例如:未来的地球人未来的地球人/王
28、佃亮王佃亮 31解构爱因斯坦解构爱因斯坦/一茗一茗 32 一流大学校长必须是教育家等一流大学校长必须是教育家等6则则/睦依凡睦依凡 36宇宙是什么颜色等宇宙是什么颜色等6则则/本刊资料室本刊资料室 42说明:说明:索引标题词(题名)索引标题词(题名)文献作者文献作者地址参照项(所在页地址参照项(所在页码或文献号)码或文献号)2.3.2 主要索引类型主要索引类型人名索引(人名索引(People Name Index)人名索引,是以文献上署名的著者、译者、编撰者、注释者以及人名索引,是以文献上署名的著者、译者、编撰者、注释者以及文献中所论述的人物名称作为索引标题词所编制的一种索引。此文献中所论述的
29、人物名称作为索引标题词所编制的一种索引。此类索引一般按照人物名称的字顺组织。英、德、法、西班牙等语类索引一般按照人物名称的字顺组织。英、德、法、西班牙等语种的著者索引姓在前、名在后,与其在文献中出现的姓名形式不种的著者索引姓在前、名在后,与其在文献中出现的姓名形式不同,用户检索时应注意掌握其排列规则。同,用户检索时应注意掌握其排列规则。例一:例一:Sadykov,A.A.Chemical Study of Persica 91:135089k 例二:Harris,A.E.001536 例三:伽利略伽利略(Galilei,Galilei)B503.922 例四:梁启超梁启超(1873-1929)
30、B259.1说明说明索引标题词索引标题词说明语(原文名,生卒年)说明语(原文名,生卒年)地址参照项(文地址参照项(文摘号、分类号)摘号、分类号)2.3.2 主要索引类型主要索引类型文献序号索引文献序号索引(Document Number Index)文献序号索引,是根据信息资源的外表特征文献序号所编制的索文献序号索引,是根据信息资源的外表特征文献序号所编制的索引。在一些特定类型的文献资源中,每一份文献都有一个特定的引。在一些特定类型的文献资源中,每一份文献都有一个特定的专门排序号。如科技报告号、合同号、技术标准的标准号、专利专门排序号。如科技报告号、合同号、技术标准的标准号、专利说明书的专利号
31、,图书的国际标准书号(说明书的专利号,图书的国际标准书号(ISBN)等;)等;例一:合同例一:合同/基金号索引(基金号索引(CONTRACT/GRANT NUMBER INDE)MIPR-FY 7616-02-00394 Cold Regions Research and Engineering.Hanover.NH AD-A121 330/5 933 MIPR-82-504 Vaval Research Lab.Washington,DC AD-A121 087/1 714 说明:说明:合同基金号合同基金号 执行机构执行机构 报告号报告号 索引地址号索引地址号2.3.2 主要索引类型主要索引
32、类型引文索引引文索引(Citation Index)引文索引是从被引论文检索引用论文的索引工具。即以某较早公发引文索引是从被引论文检索引用论文的索引工具。即以某较早公发发表的论文为起点,逐一查询那些引用过该论文的文献,随后还发表的论文为起点,逐一查询那些引用过该论文的文献,随后还可以利用检索到的引用文献为被引文献进行循环检索,逐步扩大可以利用检索到的引用文献为被引文献进行循环检索,逐步扩大检索范围,以了解和掌握一大批具有相关关系的科学文献。引文检索范围,以了解和掌握一大批具有相关关系的科学文献。引文索引的组织方式是,按照被引论文的作者排列,在被引论文之下,索引的组织方式是,按照被引论文的作者排
33、列,在被引论文之下,在按年代列举引用过该文献的全部论文。在按年代列举引用过该文献的全部论文。分类索引分类索引(Classification Index)分类索引是以文献内容的学科范围的分类标识(又称分类号)为依分类索引是以文献内容的学科范围的分类标识(又称分类号)为依据编制而成的引文系统。本索引可提供按学科专业系统检索文献据编制而成的引文系统。本索引可提供按学科专业系统检索文献的途径。的途径。分类索引的编制原理是概念的划分与概括。在概念划分与概括的原分类索引的编制原理是概念的划分与概括。在概念划分与概括的原理基础上建立起来的等级体系分类系统是一种先组式的索引语言。理基础上建立起来的等级体系分类
34、系统是一种先组式的索引语言。2.3.2 主要索引类型主要索引类型主题索引主题索引(Subject Index)主题索引,是将表征文献主题内容的主题词作为索引标题词,其后主题索引,是将表征文献主题内容的主题词作为索引标题词,其后注明地址(或页码)编制而成的索引系统。此处所指的主题词是注明地址(或页码)编制而成的索引系统。此处所指的主题词是经过规范,有词表控制的标题词(经过规范,有词表控制的标题词(Subject heading)以及词组和短以及词组和短语。这是一种先组式的索引语言。语。这是一种先组式的索引语言。例例1Sword,Manufacture,review on.6385.4246.53
35、67(赤刀)赤刀)(制照)(有关评论)(制照)(有关评论)Parallel-access computer,in self-organizing 1234.6533.4211(并行存取计算机)并行存取计算机)(自组织系统中的)(自组织系统中的)例例2例例3反义词,反义词,汉语汉语现代现代 H136.2说明:说明:索引标题词索引标题词 说明语(修饰语)说明语(修饰语)地址参照地址参照2.3.2 主要索引类型关键词索引关键词索引(Keyword Index)又称键词索引,属于广义的主题索引。这是从文献题名、文摘、原又称键词索引,属于广义的主题索引。这是从文献题名、文摘、原文或网站、网页、网址甚至网
36、页正文中抽取对于表述信息资源的文或网站、网页、网址甚至网页正文中抽取对于表述信息资源的主题内容具有关键意义的名词或名词性词组,作为索引标题词,主题内容具有关键意义的名词或名词性词组,作为索引标题词,其后标明出处所组成的索引。关键词是信息资源的责任者(包括其后标明出处所组成的索引。关键词是信息资源的责任者(包括著者、编者、译者、专利权拥有者等)所直接使用的词语,是一著者、编者、译者、专利权拥有者等)所直接使用的词语,是一种未经规范的自然语言。种未经规范的自然语言。关键词索引的类型:关键词索引的类型:题内关键词索引(题内关键词索引(Keyword in Context Index)题外关键词索引题
37、外关键词索引(Keyword out of Context Index)双重关键词索引(双重关键词索引(Double KWIC Index)轮排关键词索引(轮排关键词索引(Permuted Keyword Index)单纯关键词索引(单纯关键词索引(Keyword Index)挂接主题词索引挂接主题词索引(Articulated Subject Index)2.3.2 主要索引类型组配索引组配索引(Coordinate Index)组配索引是根据叙词(组配索引是根据叙词(Descriptor)及单元词(及单元词(Uniterm)的后组式原的后组式原理建立起来的索引系统。其基本原理是任何一个复杂
38、的概念都可理建立起来的索引系统。其基本原理是任何一个复杂的概念都可以划分出若干个单义概念,而若干个单义概念又可构成一个复杂以划分出若干个单义概念,而若干个单义概念又可构成一个复杂概念。组配索引的基本特点是,在建立索引系统时,首先有将文概念。组配索引的基本特点是,在建立索引系统时,首先有将文献的主题分解成一些单独的概念单元进行分别记录与标识,而在献的主题分解成一些单独的概念单元进行分别记录与标识,而在检索时,根据检索课题的需要,将若干有关概念单元综合组配成检索时,根据检索课题的需要,将若干有关概念单元综合组配成各种检索提问实施检索。例如各种检索提问实施检索。例如“化学纤维工业化学纤维工业”这个复
39、杂概念可这个复杂概念可以分解为以分解为“化学化学”、“纤维纤维”“工业工业”三个概念单元,其三者的三个概念单元,其三者的逻辑关系如下图:逻辑关系如下图:化学化学纤维纤维工业工业ABCabacbcabc2.3.2 主要索引类型PRECIS索引索引(Preserved Context Index)又称保留上下文关系索引系统、保留正文索引系统、保留又称保留上下文关系索引系统、保留正文索引系统、保留愿意索引、上下文前后关联索引。愿意索引、上下文前后关联索引。PRECIS 为了明确无为了明确无误地描述文献主题,力求每条索引款目都按照误地描述文献主题,力求每条索引款目都按照“上下文上下文从属从属”的原则排
40、定词语的次序。的原则排定词语的次序。其索引的方式为:其索引的方式为:导词(导词(LEAD)限定词限定词(QUALIFIER)展示词展示词(DISPLAY)地址(地址(ADDRESS)2.3.2 主要索引类型网络信息自动索引网络信息自动索引(Web source auto-Index)目前,目前,Internet上的搜索索引(又称搜索引擎上的搜索索引(又称搜索引擎 search engine)就是一种网络资源自动索引的检索工具。其特点就是一种网络资源自动索引的检索工具。其特点是使用自动索引软件来发现、收集和标引网页建立查询是使用自动索引软件来发现、收集和标引网页建立查询数据库,并以数据库,并以W
41、eb形式给用户提供检索界面,供用户输形式给用户提供检索界面,供用户输入检索关键词、词组或短语等检索项,代替用户在数据入检索关键词、词组或短语等检索项,代替用户在数据库中查找与提问相匹配的记录,并按相关度排序输出检库中查找与提问相匹配的记录,并按相关度排序输出检索结果。目前,比较有影响的中英文搜索引擎有索结果。目前,比较有影响的中英文搜索引擎有Alta Vista、Excite、Lycos、Hotbot、Sohu、Yahoo、etang、Sina等。第3章 信息存取技术与信息检索方法 信息存取技术的进步信息存取技术的进步信息信息检索方法与策略检索方法与策略 信息存储与检索相关学科及发展信息存储与
42、检索相关学科及发展 3.1 信息存取技术的进步信息存取技术的进步光盘存储与检索技术光盘存储与检索技术联机存取技术联机存取技术全文存取技术全文存取技术多媒体存取技术多媒体存取技术超文本与超媒体存取技术超文本与超媒体存取技术网络存取技术网络存取技术视频存取技术视频存取技术智能检索技术智能检索技术3.2信息检索方法与策略 提问检索式构造提问检索式构造 检索词、提问检索式与关系算符检索词、提问检索式与关系算符 检索式构造规则检索式构造规则 布尔逻辑算符布尔逻辑算符 逻辑逻辑“与与”AND 或或*主要用于交叉概念或限定关系概念之间的组配。主要用于交叉概念或限定关系概念之间的组配。逻辑逻辑“或或”OR 或
43、或+主要用于并列关系的概念组配。主要用于并列关系的概念组配。逻辑逻辑“非非”NOT 或或-主要用于排斥与选择关系的组配。主要用于排斥与选择关系的组配。布尔逻辑算符执行的优先顺序为布尔逻辑算符执行的优先顺序为NOT、AND、OR。3.2.1 检索提问式构造 位置逻辑算符位置逻辑算符 (W)或或()With (wn)(N)Near (nN)(F)Field (S)Sub field (L)Link (C)Citation (X)和和(nX)在位置算符的前面加上在位置算符的前面加上NOT即可构成位置算符的逻辑即可构成位置算符的逻辑(非非)3.2.1 检索提问式构造 检索字段限定符检索字段限定符 基本
44、索引字段的限定检索。为了指定在基本索引的哪个或哪几个基本索引字段的限定检索。为了指定在基本索引的哪个或哪几个字段中检索,可在检索词或检索式后面加上一斜杠字段中检索,可在检索词或检索式后面加上一斜杠“/”,再加上,再加上所需限定字段标识。一般将加有所需限定字段标识。一般将加有“/”线的字段标识称为后缀代码线的字段标识称为后缀代码(简称后缀)。(简称后缀)。表表3.1 常见后缀代码及其限定查找的字段范围常见后缀代码及其限定查找的字段范围 后缀代码后缀代码 限定查找的字段范围限定查找的字段范围 /TI 题名题名 /AB 文摘文摘 /DE 叙词叙词 /ID 自由标引词自由标引词 /NT 注释注释 /S
45、H 类目标题类目标题3.2.1 检索提问式构造辅助索引字段的限定检索。为了指定在辅助索引字段中进行限定辅助索引字段的限定检索。为了指定在辅助索引字段中进行限定检索,可在该检索项(词)的前面加上字段标识与一个等到号检索,可在该检索项(词)的前面加上字段标识与一个等到号“=”,通常将这种字段标识符称为前缀代码(简称前缀)。,通常将这种字段标识符称为前缀代码(简称前缀)。表表3.2 常见前缀代码及其所限定的字段名称常见前缀代码及其所限定的字段名称 AU =author(著者著者)CS =corporate source(著者所属机著者所属机构构)DT =Document Type(文献类型文献类型)
46、JN =Journal Name(期刊名称期刊名称)CO =Company(公司公司)CC =Classification Code(分类号分类号)SO =Source publication(来源出版来源出版物物)LA =Language(语种语种)PY =Publication year(出版年份出版年份)UD =Update(更新日期更新日期)SP =Conference sponsor(主持单位主持单位)3.2.1 检索提问式构造 截词检索算符截词检索算符 所谓截词检索算符,是指在检索词的某个所谓截词检索算符,是指在检索词的某个局部截断,利用检索词的词干或不完整的词形加局部截断,利用检
47、索词的词干或不完整的词形加上截词符号所进行的检索。上截词符号所进行的检索。后截词后截词前方一致检索前方一致检索 前截词前截词后方一致检索后方一致检索 中截断中截断前后方一致检索前后方一致检索 前后截断前后截断中间一致检索中间一致检索 有限截词有限截词 无限截词无限截词3.2.1 检索提问式构造检索提问式的构造检索提问式的构造句子切分句子切分词汇剔除词汇剔除概念替换概念替换概念限定与补充概念限定与补充组合式检索式组合式检索式3.2.2信息检索一般方法 工具法工具法 又称一般查找法,即利用各类检索系统(工具),包括书本又称一般查找法,即利用各类检索系统(工具),包括书本式与电子文本方式,直接检索信
48、息的方法。工具法又分为式与电子文本方式,直接检索信息的方法。工具法又分为3种情种情况:况:顺查法顺查法 逆查法逆查法 抽查法抽查法 追溯法追溯法 这是一种传统的文献检索方法,即利用文献后面所附参考文这是一种传统的文献检索方法,即利用文献后面所附参考文献,逐一追查被引用文献,然后,再从被引用文献所附参考文献献,逐一追查被引用文献,然后,再从被引用文献所附参考文献目录逐一扩大检索范围的方法。目录逐一扩大检索范围的方法。综合法综合法 亦称循环法或分段法,它指分期分段交替使用上述各种检索亦称循环法或分段法,它指分期分段交替使用上述各种检索方法以达到优势互补,获得理想结果的一种检索方法。方法以达到优势互
49、补,获得理想结果的一种检索方法。3.2.3计算机检索常用法 计算机检索方法:计算机检索方法:菜单检索菜单检索(Easy Menu search)(Easy Menu search)指令检索指令检索(Command Search)(Command Search)浏览式检索浏览式检索(Browsing Search)(Browsing Search)提问提问问答式检索问答式检索(Quiz&Answer Search)(Quiz&Answer Search)根据存取系统的性能与支持的检索功能根据存取系统的性能与支持的检索功能,可将提问可将提问问答式检问答式检索区分为以下方式索区分为以下方式:基本检索
50、基本检索(Basic Search or Simple Search or Quick(Basic Search or Simple Search or Quick Search)Search)二次检索二次检索(Second Search)(Second Search)词组检索词组检索(Word Combination(Word Combination Search)Search)索引词典检索索引词典检索(Catalog Search)(Catalog Search)高级检索高级检索(Advanced(Advanced Search)Search)综合检索综合检索(Synthesis Sear