2023年信息检索学习笔记.pdf

上传人:文*** 文档编号:88937154 上传时间:2023-05-04 格式:PDF 页数:40 大小:5.33MB
返回 下载 相关 举报
2023年信息检索学习笔记.pdf_第1页
第1页 / 共40页
2023年信息检索学习笔记.pdf_第2页
第2页 / 共40页
点击查看更多>>
资源描述

《2023年信息检索学习笔记.pdf》由会员分享,可在线阅读,更多相关《2023年信息检索学习笔记.pdf(40页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、信息检索第一章信息检索的基础理论第一节基础概念一、信息概述(一)信息的定义:信息指的是事物的存在方式和运动状态,是对客观世界中各种事物变化和特性的反映,是客观事物之间互相作用和联系的表征,是客观事物通过感知或结识后的再现。世界三大基本要素:信息物质能量(二)信息的特性1.客观性信息来源于物质,又不是物质自身:它从物质的运动中产生出来,又可以脱离物质相对独立地存在。信息业来源于精神世界,但又不限于精神的领域。信息是具体的,并且可以被人所感知、提取、辨认,可以传递、存储、变换、显示、检索和运用。2.普遍性3.可存储性 4.可 传 递 性 5.扩 散 性 6.共享性7.时效性(三)信息的功能1.经济

2、功能运用信息可以使非资源转化为资源发明财富。使用信息取代劳动力、资金、材料等资源发明财富,实现经济效益倍增。直接让信息作为商品在市场流通中发明财富。通过信息进行科学决策,减少失误,发明财富。2.管理与协调功能5M 资源:人、财、物、设备、管理办法信息的管理与协调功能在组织活动中的作用:传递整个组织的运营目的,有效管理5 M 资源。调节和控制物质流和能源流的数量、方向和速度。传递外界对系统的作用,保持组织的内部环境稳定。3.选择和决策功能4.研究与开发功能二、知识1.知识的概念:知识是人类社会实践经验的总结,是人的主观世界对于客观世界的概括和如实反映,是人类对自然界、人类社会以及思维方式与运动规

3、律的结识。2 .知识的类型显性知识和隐性知识。实体知识和过程知识。核心知识和非核心知识。三、情报1.情报的概念:情报是具有特定传递对象的特定知识货有价值的信息。2.情报的特性动态性按特定的方式传递为特定目的服务的经常有一定的时效性和机密性3.情报的类型零次情报:私人笔记、手稿、设计草图、会议记录、口头言论等。一次情报:调查报告、研究报告、科学论文、专利说明书、会议文献、专著等。二次情报:书目、索引、文摘等三次情报:综述、专题评论、年度总结、研究进展报告、数据手册、专业年鉴等。四、信息、知识和情报之间的关系知识是人的大脑通过思维重新集成整合的、反映事物运动规律的系统华信息,是信息中最有价值的部分

4、;情报是具有特定传递对象的特定知识或有价值的信息,其中一部分在知识之内,另一部分则在知识之外的信息之内。因此,从逻辑上看,信息、知识、情报三者的概念之间是相容关系,具体来说,信息与知识、情报之间是属种关系,信息是属概念,知识、情报是信息之下具有交叉关系的种概念。五、信息资源(一)信息资源的概念1 .广义信息资源的定义:人类社会活动中积累起来的信息、信息生产者、信息技术等信息活动要素的集合。人类社会经济生活中通过加工解决使之有序化并大量积累后的有用信息的集合。为某种目的而生产有用信息的信息生产者的集合。加工、解决和传递有用信息的信息技术的集合。2.狭义信息资源的定义:人类社会经济活动中通过加工解

5、决,使之有序化,并大量积累后的有用信息的集合。(二)信息资源的特性1.信息资源的一般特性作为生产要素的人类需求性稀缺性因素:一、信息资源的开发需要相应的成本;二、在既定的技术和资源条件下,任何信息资源都有一固定不变的总效用,但它每次被投入经济活动中去时,资源使用者总可以得到总效用中的一部分并获得一定的利益,随着被使用次数的增多,这个总效用会减少,当减少到零时,该信息资源就不再具有经济意义。使用方向的可选择性。2.信息资源的特殊性共享性时效性(三)信息资源的类型1、体裁信息资源:以人体为载体并能为别人辨认的信息资源2、文献信息资源:以文献为载体的信息资源3、实物信息资源:以实物为载体的信息资源4

6、、网络信息资源:从计算机技术、通信技术、多媒体技术互相融合而形成的网络上可查到的资源,涉及非正式出版信息半正式出版信息正式出版信息第二节信息检索概述一、信息检索的概念:广义信息检索涉及信息存储和信息检索两个过程,指将信息按一定方式收集、组织和存储起来,并根据信息用户的需求找出所需信息这一过程和技术,又 称“信息存储和检索“(I n fo rma t i o n St o r ag e a n d Re t rie v a l)狭义信息检索,不涉及信息存储过程,仅指依据一定的方法,从已经组织好的信息集合中,查找并获取特定需求的信息这一过程。二、信息检索的类型1、根据检索内容或检索对象不同,可将信

7、息检索分为文献检索、数据检索和事实检索。1 )文献检索(Docum e n t Ret r ieval):指以文献为检索对象的信息检索,传统上是信息检索的核心部分2)数据检索(Dat a Retriev a 1 ):指以各种数据为检索对象的检索3)事实检索(F a ct R etrieval):指以各种史实资料、研究结果和现状为检索对象的检索过程2、按组织方式,可有全文检索、超文本检索和超媒体检索1)全文检索(F u ll-te x t R etrieval):将存储于数据库中的整本书、整篇文章中的任意内容信息查找出来的检索2)超文本检索(Hyp e r-text R e t rieval):

8、是对每个结点中所存在的信息以及信息链构成的网络中信息的检索。3)超媒体检索(Hype r medi a Ret r ieva 1 ):是对存储的文本、图像、声音等多种媒体信息的检索。3、按检索设备分,可分为手工检索和机器检索1)手工检索(Hand Retr i eva 1 ):是人直接用手、眼、脑组织、查找印刷型文献的检索2)机器检索(M a chine R e trie v al):又称计算机检索,是通过机器对已经数字化的信息按照设计好的程序进行查找和输出的过程,可分为脱机检索和联机检索。三、信息检索的发展趋势1、统一的检索界面2、积极的信息推送服务3、多种检索模型将融为一体4、可视化技术实

9、用化5、检索职能化第三节信息检索原理一、信息检索基本原理:信息检索涉及信息存储与信息检索两个过程。信息存储过程中,信息标引人员分析原始信息,找出能代表文献信息的特性,对文献信息进行标引,对照检索语言将其外部特性和内容特性转化为一定的标引标记,再将这些标记按一定的顺序编排后纳入检索系统,提供多种检索途径:而在信息检索过程中,检索人员全面详尽地分析课题,找到其特性形成检索提问,再将这些提问与检索语言相对照形成检索提问标记。信息检索的基本原理:检索提问标记与存储在检索系统中的标引标记进行比较,两者完全匹配或信息标引中的标记包含了检索提问中的标记,即为检索命中,具有该标记的信息就从检索系统中作为检索结

10、构输出。二、计算机信息检索的原理1、计算机信息检索的实现过程:用户对检索课题加以分析,明确检索范围,弄清楚主题概念,然后用系统检索语言来表达主题概念,形成检索标记及检索策略,输入到计算机进行检索。分为两个过程:一是信息存储,即按一定的规则将信息进行加工、赋予特性标记,并将这些标记按一定的顺序编排后纳入检索系统;一是信息检索,就是用户根据自己的检索规定向系统发出具有提问特性的检索式,系统自动地将自己存储的相关信息集合的标引标记及其逻辑组配关系与之类比、匹配,给出与特性标记相符的记录。2、计算机信息检索的实现条件:计算机、通信网络、检索终端设备和数据库3、计算机信息检索的发展1)脱机批解决检索阶段

11、2)联机检索阶段3)光盘检索阶段4)网络化检索阶段4、计算机信息检索的服务方式1)回溯检索2)定题检索3)随机问答4)联机订购第四节检索语言一、检索语言的概念:一般指文献标引和检索所使用的一种专门语言,是用以表达概括文献信息特性和检索课题内容特性的概念及其互相关系的一种概念标记系统,即在存储时用以描述文献信息的内容和外部特性,而在检索时则用以表达提问的语言。二、检索语言的类型一是按检索语言的规范化限度来划分,可分为规范化的人工语言和非规范化的自然语言;二是按检索语言的词汇组配方式来划分,可分为先组式语言和后组式语言;三是按描述文献信息内容特性来划分,可分为分类语言和主题语言;四是按词汇的类型来

12、划分,可分为关键词语言、单元词语言、标题词语言和叙词语言等。1、人工语言和自然语言1)人工语言:又称程控语言,它是根据文献信息检索的需要,由人工采用规范词而创建的一种受情报检索控制的语言。2)自然语言咱然语言检索用词是取其自然形态,从信息内容自身抽取,不受人工控制,重要依赖于计算机自动抽词技术来完毕,但是需要辅以人工自由标引,即不依据词表的标引方法,使用非规范词或称自由词。3)人工语言与自然语言的比较:人工语言的查全率、查准率比较高,人工语言的检索效率要高于自然语言,但是人工语言是基于印刷型文献资源产生的,对标引来说,工作量大,成本高,对文献信息检索来说,用户不容易掌握。而自然语言则不然,对标

13、引来说,重要由计算机检索系统自动完毕,具有灵活性、新奇性和专指性,并且检索点多,管理和维护成本低;对文献信息检索来说,用户很容易掌握。但是由于目前计算机抽词技术还无法达成从自然语言中抽取最准确并可以表达信息资源内容的词,无法自动规范自然语言,无法指示概念之间的关系,缺少对词汇的控制能力,因此检索效率比较低。2、先组式语言和后组式语言1)先组式语言:是指在检索实行前己事先组配好的一种检索语言,有较好的直接性和专指性,但灵活度查,如标题词语言。2)后组式语言:是指在检索实行前未事先组配好的、以单元词等形式出现的一种检索语言。3、分类语言和主题语言1)分类语言:分类语言是按学科范畴和知识之间的互相关

14、系列出类目,并用数字、英文字母对类目进行标记的一种检索语言。2)主题语言:又称主题词语言或主题词检索语言,由主题词汇构成,也就是将自然语言中的名词术语通过规范化后直接作为文献信息标记,因此又称主题词表、主题词语言或主题法,如关键词语言、单元词语言、标题词语言、叙词语言等。关键词语言属于自然语言单元词语言,属于人工语言,又称元词,元词语言是后组式语言标题词语言是一种先组式规范语言,属于人工语言。如 工程索引,用标题词检索叙词语言是一种后组式规范语言,也属于人工语言。第五节检索系统与数据库一、检索系统1、检索系统的概念:检索系统是为满足信息需求而建立的,具有收集、组织、存储和查询等功能的文献信息资

15、源和相关设备设施的总称,由信息资源库、技术设备、规则体系和检索人员组成,其中信息系统的主题部分是信息资源库。2、检索系统的类型1)按加工手段和技术设备的不同,可将检索系统分为手工检索系统、机械检索系统、计算机检索系统2)按载体形式不同,可分为卡片式、书本式、缩微式、磁性材料式等检索系统3)按著录格式不同,可将检索系统分为目录、题录、文摘、索引、全文检索系统。3、计算机信息检索系统的组成:信息选择子系统、标引子系统、建库子系统、词表管理子系统、用户接口子系统(信息检索系统的用户接口常采用命令检索、菜单检索、图像检索及超文本检索等方式)、提问解决子系统(本模块重要由检索程序构成,执行过程中可完毕以

16、下操作:接受提问、提问校验、提问加工、检索)组成。信息选择子系统:任务是根据系统的目的和服务对象的需要,拟定数据收集范围,拟定数据收集范围,并广泛地、定期地采集各种信息源,为系统提供充足而合用的数据。二、数据库1、数据库概述数据库:至少由一种文档组成,并能满足某一特定目的或某一特定数据解决系统需要的一种数据集合。2、数据库的结构1)数据库一般结构:字段、记录、文档。顺排文档和倒排文档基本索引、辅助索引2)从数据库用户的角度看,数据库的结构可分为集中式、分布式、并行式、异构式数据库结构,客户机/服务器结构和浏览器/服务器结构。3、数据库的特点:1 )数据库的数据具有结构化的特点;2)数据库中所存

17、储的数据是面向现实世界的;3)数据库中的数据的共享性好,冗余度低;4)数据库中数据的独立性强;5)数据库由数据库管理系统统一管理和控制4、数据库的类型按提供信息的等级来分:参考数据库和源数据库按存储数据的类型来分:文献数据库、数值数据库、事实数据库、图像数据库按存储介质不同来分:磁带数据库、磁盘数据库、光盘数据库按数据模型的不同来分:层次型数据库、网状型数据库、关系型数据库按涵盖学科的不同来分:综合型数据库、专业型数据库5、文献数据库的功用1)文献数据库对文献信息的规范化管理是以往任何管理方式无法替代的2)文献数据库为用户提供了多途径的检索方式3)文献数据库可认为用户提供多种形式的服务内容。4

18、)文献数据库为用户提供了多渠道的检索服务三、数据仓库技术1、数据仓库概述数据仓库:是指一个用于更好地支持公司或组织的决策分析解决的、面向主题的、集成的、不可更新的、随时间不断变化的数据集合。2、用于事务解决的数据库系统与用于决策分析的数据仓库系统的重要区别1)事务解决与分析解决性质不同;2)数据集成问题,决策支持系统需要集成数据,而事务解决系统则不需要;3)历史数据的使用,事务解决通常只要当前数据,而决策支持系统需要详尽的历史数据。3、数据仓库的基本特性:数据仓库的数据是面向主题的、集成的、随时间不断变化的,仅供查询。4、数据仓库的技术内容:数据仓库技术、联机分析解决技术、数据挖掘技术。*第二

19、章信息检索的基本技术第一节信息检索技术概述一、信息检索的一般方法1、常用法:又称直接法、常规法,指直接运用文摘、索引等检索工具查找文献的方法,涉及顺查法、倒查法、抽查法2、引文追溯法:是运用参考文献间的引用与被引用的关系进行检索的方法,即从已有的文献所附的参考文献开始追踪查找原文,再以原文所附的参考文献作为起点追查更多的原文,逐级追查,不断扩大检索线索3、循环法、又称分段法、综合法二、检索途径检索途径:以文献的外部特性进行检索的途径和以文献信息的内容特性进行检索的途径,前者涉及题名途径、著者/机构途径、号码途径等,后者涉及分类途径、主题途径等。1、分类途径;2、主题途径;3、题名途径;4 引文

20、途径;5、序号途径和符号代码途径;6、全文关键词途径7、著者/机构途径;8、其他途径三、检索策略广义的检索策略是为实现检索目的而制订的所有检索计划,即在对课题进行全面、实质分析的基础上,选择检索系统、检索途径和检索词,明确各词之间的逻辑关系,并根据各检索词之间的关系和系统,允许使用的各种算符、限定字段等组建检索式,拟定检索环节狭义的检索策略是检索提问式1、检索词:简明、准确地概况检索规定的词语2、检索式:又称检索提问式,是检索策略的某种具体体现3、检索策略的制定和调整1)检索策略的制定:制定检索策略不仅要全面、准确地对课题进行概念分析,拟定概念单元和概念之间的关系,并且要熟悉有关的检索系统,2

21、)检索策略的调整扩大检索范围:扩大约念;增长同义词或同族相关词并运用逻辑或进行组配、减少检索词或少用逻辑与算符、减少位置算符的使用或有关的字段限制;扩大3、检索的年代、文献类型、文种范围等方法达成目的缩小检索范围:缩小检索概念;使用逻辑与等算符;缩小检索的年代、文献信息源范围使、检索程序1、全面分析课题,拟定信息需求和检索目的2、选择检索系统(检索工具),我们应当在课题分析的基础上,根据课题的特点,ix n x i需求,检索目的,选择专业对口、覆盖范围广、更新及时、内容准确权威、检索功能完备的检索系统3、拟定检索途径和检索方法4、拟定检索词及检索词之间的关系,编制检索式5、检索,并根据需要随时

22、调整检索策略,得到所需检索结果6、索取原始文献信息五、原始文献获取途径(-)直接通过网络获取原始文献1)通过搜索引擎查找:直接通过搜索引擎查找运用搜索引擎与数据库、图书情报机构的合作,实现对这些合作机构文献信息产品的检索与运用;2)网络出版物及网络出版物目录3)出版商4)学术网站5)免费全文数据库6)通过文摘、题录数据库提供的订购途径购买(二)简介获取原始文献:先查到馆藏地点,再通过与该图书馆联系获取原文1、查找馆藏地点1)特定图书情报机构的馆藏目录;2)联合目录 全国期刊联合目录 全国高校图书馆进口报刊预订联合目录 C A SH L 图书期刊联合目录 C A L IS图书期刊联合目录O C

23、L C 图书、期刊联合目录中国科学院中西文图书联合目录数据库;3)数据库中的馆藏字段连接馆藏字段电子期刊全文连接通过馆际互借获取原文通过文献传递获取原文4)出版商提供的出版信息2、从实体图书获取原文(三)通过个人与有关机构的交流获得第二节计算机信息检索技术一、系统支持的语法(一)计算机信息检索的常用算符1、布尔逻辑算符:逻辑或、逻辑与、逻辑非1)逻辑加(O R 或“+”也 称“或”运算,这是反映概念之间并列关系的-种组配方式,可扩大检索范围、增长输出量,以免漏检2)逻 辑 乘(A N D 或“*”),也 称“与”运算。这反映概念之间交叉和限定关系的-种组配方式,用以缩小检索范围,减少输出结果,

24、提高查准率3)逻辑非(N O T 或A NOT B一用于从包含A 的文献信息范围中减去具有B 的内容。这些逻辑算符在运算中的优先顺序一般为:NOTAND OR2、优先解决算符3、位置算符:位置算符用于表达词与词之间的互相关系和前后的顺序,通过对检索词之间位置关系的限定,进一步增强选词指令的灵活性,提高检索的查全率与查准率1)W算 符(W i th):通常写作A(nW)B,表达词A 与 词 B 之间之多可以插入n 个其他的词(涉及系统禁用词),同时A、B 保持前后顺序不变2)N 算符(Near):通常写作A(nN)B,表达A 与 B之间之多可以插入n 个其他词,同时A、B不必保持前后顺序3)S

25、算 符(S ubf i eld):通常写作A(S)B,表 达 A 与 B 必须同时在一个句子中或同一子字段内出现,但顺序可随意变化,且各词间可加任意词4)F 算符(Field):通常写作A(F)B,表 达 A 与 B 必须同时出现在同一记录中,不限定词序和字段,其作用同布尔逻辑算符“AND”(-)截词(截断)检索截词检索重要是运用检索词的词干或不完整的词形进行非精确匹配检索,凡具有词的这一部分的所有字符或字符串的文献信息,均被认为是命中结果。1、从截断字符的数量看,截词可分为无限截词和有限截词1 )无限截词,一个无限截词符可代表多个字符,表达在检索词的词干后可加任意个字符或不加字符。符号:“*

26、”/”“?”2)有限截词,符 号“?”(S TN系统中为“#”)代表这个单词中的某个子目可以任意变化,在检索词词干后可加一个或一个以上的有限截词符,一般有限截词符的数量有限制,其数目表达在词干后最多允许变化的字符个数2、根据截断的位置,可以分为后截断、前截断和中截断(三)字段限制检索数据库中可检字段分为基本索引字段和辅助索引字段两大类,字段索引即限定检索词只在记录中某个或某些字段中出现,不同的检索系统规定的检索字段和字段限制检索方法也不同,其形式涉及前缀限制符、后缀限制符、检索字段框等联机检索系统常用到前缀限制符和后缀限制符(四)禁用词禁用词都是些无实际意义的词,也就是不可用于检索的过于常见的

27、词(高频词),如DIALOG系统中的and,f o r,t he,a n,from,t o,by,of,wi t h等,假如检索词中包含这些词,和碰到标点符号、连字符同样,有些检索系统使用位置算符来解决二、输出格式和输出方式()输出格式输出格式:系统所检出的信息的形式,可以是文献号、题录、文摘或全文等。(-)输出方式三、光盘数据库检索(一)光盘与光盘数据库概述计算机信息检索是借助计算机获取信息的手段,重要涉及脱机检索、光盘检索、联机检索、网络数据库检索、以及基于因特网的信息检索1、光盘检索与联机检索相比有其自身的特点1)光盘数据库成本较低,配置简朴2)购买光盘是一次性投入,使用时间不受限制3)

28、光盘检索系统是一个独立的系统,不受通讯费和机时费的限制4)检索方便快捷,操作简朴易学5)光盘数据库与联机数据库相比,也存在着更新周期长、数据容量有限、各种光盘数据库规格不一,查询多个数据库时要频繁更换,许多光盘检索系统需要专用的加密卡才干打开等问题2、光盘数据库并没有完全被后来的网络数据库所代替,是由于光盘数据库与网络数据库相比有自己的优势成本低,投入较少运营速度快安全性好使用时间长光盘检索系统尚有下载方便、检索效果好等优势,同时也有缺陷,像更新周期长,使用范围有限等。相对来说光盘数据库的规模不是很大,一般以某一学科为主,所以有时候会影响查全率,并且因其存储容量有限,使用时常要换盘,不是很方便

29、。(二)光盘数据库检索系统概述光盘数据库是一种机读文献,一般由计算机、光盘及其驱动器、相应软件构成(三)光盘数据库检索的基本环节选择光盘数据库安装检索解决检索结果退出四、联机检索(一)联机检索(O n-line R etriev al)概况1、概念联机检索:是指在检索终端上,通过通讯线路,以人机对话方式,使用一定的指令和算符,与检索中心的中央计算机联机,从该检索系统的数据库中检索所需信息的一种计算机检索式2、国际联机检索的特点数据库资源丰富检索速度快、效率高,输出方式和格式多种多样提供的文献信息全面、准确、可靠、及时安全费用较高,涉及联机检索费和通讯费等3、联机检索的程序分析课题,明确检索目的

30、拟定检索词和检索策略,联机前可进行人工预检接通联机检索系统选择数据库输入检索式,检索分析联机显示的检索结构,判断检索是否已经成功选择输出格式和输出方式,输出检索结果(-)联机检索实例1、D I A LO G:这个系统最初由美国洛克希德导弹航空公司所属的一个情报科学实验室建1)D I A L O G 系统的重要数据库工程索引,EI,1 9 7 0 年至今科学文摘,I N SP E C,1 9 6 9 年至今世界专利索引,WPIJ96 3 年至今化学文摘,C A Search,1 967年至今科学引文索引,S c iSearch,1 97 4 年至今经济商业文摘ABI/IN F O RM,1 97

31、1 年至今学位论文文摘Disser t ation A b strac t s O n 1 i n e,1 98 6 年至今美国政府技术报告NTIS1 964年至今医学索引Medicus生物技术和生物工程数据库国际药文摘2)检索入口 DIA LOG 联机检索In t eme t Web 界面检索,涉及 Dialog Web;DialogC l a s sic(纯文本界面);DialogSelect(非专业检索人员的Web界面);数据库蓝页网址;免费检索题名信息可进入 D I A LOG OPEN A C C E SS3)D IA LO G系统提供的服务,涉及追溯检索(RS)、定题检索(SD I

32、)新奇性检索服务等,此外尚有:D IA LO G B usi n es s C o nneecti o n(D B C),系统提供的一种针对商业信息而设的菜单检索服务,对大量的商业查询可提供快速准确的回答DIA LOG Al e r t Serv ic e.系统提供的一种定题检索服务Dialma i 1,系统提供的电子邮件服务D i alord er,系统提供的联机文献订购服务,可由此获取原始文献Dial index,系统提供的联机文献订购服务,由此可获知哪些数据库中有用户需求的信息On eSea r c h,系统提供的一种独特的检索手段,可由此从多个数据库中检索和显示记录D i alogLi

33、nk,是专门用于联机检索的软件4)DIA LOG数据库检索逻辑算符常用的位置算符,涉及W I TH/NE A R/SENTENC E(句 子)/F IELD(字段)/C ITA T I O N(记录)截词算符,涉及有限截词算符、无限截词算符、屏蔽符前缀和后缀,从查准率角度来看,用题名/T I字段检索效果最佳,接下来是主题/DE、自由词/ID 和文摘/A B DIA LO G系统中有九个禁用词:and,for,Ih e,an,from,to,b y,of,w i thDIA LOG系统常用指令,涉及B e gi n,选择数据库,开始检索/Sei e ct,指定检索的内容/Se 1 ect Ste

34、ps,分环节检索指定要检索的内容/C ombin e,运用逻辑算符对检索单元进行逻辑组配/Expa n d,扩展检索/Sa v e 和 Save Tem p,用以保存或暂时保存检索策略/Recall调用保存的检索策略/D i splay S e ts,联机显示已执行的检索策略/Type,联机连续显示检索结果/Print,脱机打印检索结果/L o g o ff和 L o go f f Hol d,L o g o ff用于中断与检索系统的连接检索程序2、S T N 系统国际科技信息网络,简称STNI)STN系统的特点通过ST N 可以获取的信息很多更新速度快,每周或天天更新检索速度与跨文档检索ST

35、N 特有的服务,如结构检索、马库什结构检索、化学反映检索、生物序列检索等功能2)STN 有三种检索入口:STNonthe we b STN Eas y STN C 1 as s i c3)STN系统获取原文的方式第三节检索效果评价一、检索效果与衡量检索效果的指标1、检索效果2、衡量检索效果的指标:查全率、查准率、漏查率、误查率P65此外尚有新奇率,即系统检出的最近单位时间内发表文献信息量,与最近单位时间内发表的文献信息总量的比率:检索速度,即系统输出的文献信息量与本次检索所用时间之间的比率,以及检索费用,即用户为本次检索花费的费用等。+第三章中文信息资源检索第一节中文信息检索工具概述一、信息检

36、索和检索工具1、信息检索与检索工具的概念信息检索是研究文献信息资源的存储和查找的原理与方法的一种学问,是一种通过检索技术而达成查检符合特定需要的信息资源,或文献线索的方法实现过程;而检索工具是存储、传递知识信息的载体,是人们为进行文献信息查检而编制的具有存储和检索作用的检索工具或建成的检索系统,它是根据特定需求,对原始文献进行筛选、浓缩、有序组织、提供文献线索和知识的一种特殊的文献类型2、检索工具的功能及作用检索工具具有存储和检索两个方面的功能作用:充足发挥人类知识宝库的作用,促进智力资源的开发有助于指引治学门径,借鉴人类已有的研究成果避免反复劳动,提高工作效率3、信息检索工具的发展趋势二、信

37、息检索工具类型按检索工具的载体形态划分,有书本式、卡片式、期刊式、附录式、缩微式、机读型等按检索手段分,有手工检索和计算机检索两大类按检索工具编制体例、内容和功用分,有指引型检索工具和参考型检索工具1、指引型检索工具:是在一次文献的基础上整理、编制出的提供文献信息线索的二次文献,涉及书目、索引、文摘等特性:一是存储丰富的文献记录;二是具有必要的检索标记,提供检索的各种标志;三是提供检索手段,提供检索途径的辅助手段书本式指引型加诺工具的编制形式有期刊式、单卷式和附录式1)书目:又称目录,是指群书之目录,分为古典书目和现代书目现代书目涉及:国家图书书目,如 全国总书目 中国国家书目 全国新书目国家

38、报刊书目,如 中国报刊名录 中国报刊大全 中国当代期刊总览 中文核心期刊要目总览馆藏书目联合书目2)索引篇目索引字句索引专名索引引文索引,三大引文索引:科学引文索引 社会科学引文索引 社会科学引文索引3)文摘:系统报道、积累和检索科技文献的重要工具,是二次文献的核心,文摘根据其摘要方式可划分为指示性、报道性和评论性三类文摘的功用:帮助用户迅速鉴别选择文献,减少运用资料和查阅资料的盲目性;有些文摘在一定限度上可替代原文,节省阅读全文的时间;多语种文献被摘录成一种语种的文献时,可帮助用户克服语言障碍;提供学术动态和学科研究的进展2、参考型检索工具:涉及事实性工具书、数据型工具书,属于三次文献1)辞

39、典语文辞典知识性词典综合性辞书2)百科全书,可以寻检查阅有关定义、概论、说明解释、著名人物、重大事件等,具有扩大知识视野,帮助系统求知的作用,涉及综合性百科全书专科性百科全书,3)年鉴,年鉴可以查找国际、国内时事,各部门、行业的重大事件,重要活动、进展及各学科、专业的研究动态;查找政府颁布的法律、法规和逐年可比的记录数据;查找学术论著的线索及有关评价;查找有关机构、公司的简介及著名人物生平等,涉及综合性年鉴专门性年鉴记录性年鉴4)手册,手册提供事实性数据和资料,信息密集、实用性强,具有很大的参考价值,可随时翻检,涉及综合性手册专门性手册5)类书,类书可以查考事物起源,查检史实典故渊源。查找诗词

40、文句出处,检索参考资料,辑录散佚残缺古书轶文,校勘考证古籍等,涉及综合性类书,艺文类聚 太平御览 永乐大典等专门性类书 册府元龟 事物纪原等6)政书,可以查考古代典章制度及史实,由于保存了大类亡佚的古文献资料,也可用于校勘和辑佚,涉及通代型政书“十通”断代型政书“会典”“会要”7)名录,名录提供的资料准确、信息简明、内容较新、实用性强,机构名录便于沟通联系、交流信息,涉及机构名录人名录地名录8)表谱,具有查考历史年代,查找历史大事,换算不同的年、月、日,以及考察人物生平和官职、地理沿革等,涉及年表历表专门表谱9)图录,涉及地图(分为普通地图、专业地图、历史地图)文物图录、历史图录、人物图录、艺

41、术图录、科技图录10)边沿性资料三、中文检索工具的使用方法1、中文检索工具的重要排检方法1)字顺排检法部首法笔画笔形法音序法号码法2)分类排检法是将文献或知识,按学科或按事物性质系统性排列的方法,涉及按事物性质归类,如 尔雅按学科体系归类,如 七略 隋书余盥籍志3)主题排检法,该法不受学科领域限制,能使同一事物的知识相对集中,再 运 用“参照”项,沟通相关知识4)时序排检法5)地序排检法2、检索工具的选择1)指引型检索工具的使用2)参考型检索工具的使用,涉及辞典、百科全书、年鉴、手册、记录资料、数据、图录等,要注意如下方面:熟悉工具书的收录内容和排检法选择对口的工具书工具书的附录和索引的运用工

42、具书的综合运用3、检索过程中的分析与解决第二节中文传统信息源检索一、古籍文献检索1、古籍文献线索的查找1)古籍书目 别录 七略开创了叙录体提纲和六分法,七略是我国第一部以分类编排的国家藏书目录 汉 书 艺文志开创了正史艺文志的先例,是我国第一部史志书目史志书目,可记一代臧书、一代人著作、既记一代人臧书也记一代人著作,如:隋书*经籍志,此外尚有 二十五史补编官、私书目2)常用的古籍目录古籍总目,四库全书总目(又 称 四库全书总目提纲)古籍丛书目录,中国丛书综录 四部丛刊目录 四部备要书目提纲 丛书集成初编目录古籍善本目录,中国古籍善本书目馆藏目录 北京图书馆普通古籍总目3)专门性目录,是为适应各

43、种特定需求进行古籍寻检的目录,如版本目录、方志目录、禁毁书目录、伪书目录、举要目录、解题目录等2、古籍内容的检索1)运用索引检索古书特定事项2)运用类书、政书查找古籍原文,类书有 艺文类聚 太平御览等,政书有 十通索引等二、普通书刊资源检索1、图书,查找图书重要运用综合性书目,如 新华书目报 全国新书目,和各种专题书目,如 中国法律图书总目等2、报刊资料及论文检索目前使用比较广泛的综合性索引和题录有 全国报刊索引 复印报刊资料等文摘是二次文献的核心,其检索工具重要有 中国学术期刊文摘 中国学术会议文献通报如需系统查找某一领域或某一专题文献,还可以运用各学科的专题索引、文摘,并运用专业年鉴、资料

44、汇编、专题报告、综述等参考型检索工具。如检索效果不抱负,还可以考虑运用各种书目型数据库和全文型数据库,以获得专题文献线索乃至全文。二、字词、专业术语、专业知识检索检索1、查找字词,如 康熙字典等2、查找专业术语、专业知识,如专科词典,百科全书,手册,年鉴查检人物资料、地名资料、历史事件、当代人事、法规条约和记录资料,有时可综合交叉运用专科词典、手册、年鉴、百科全书、图录、名录、年谱及边沿性工具书等检索工具,还可以运用相关书目、报刊索引或计算机书目数据库、数据库查找第三节中文常用数据库检索一、中国知网1、概况中国知网全程中国知识基础设施工程,简称CNK I1)中国期刊全文数据库(CJFD)有 1

45、5个检索字段,它是目前世界最大的连续动态更新的中国期刊全文数据库。2)中国优秀博硕士学位论文数据库(CDMD)有 19个检索字段3)中国重要报纸全文数据库(C C ND)有 5 个检索字段4)中国重要会议论文全文数据库(CPCD)有 1 3个检索字段2、检索方法1)学科分类浏览检索,或称导航检索:运用知识分类导航体系逐步细化,最终检索出最小知识单元中包含的论文2)初级检索3)高级检索二、万方数据资源系统1、概况万方数据资源系统是以中国科技信息研究所(万方数据集团)所有信息服务资源为依托建立起来的,是一个以科技信息为主体,集经济、金融、社会、人文信息为一体,以 Int e rne t为网络平台的

46、大型科技、商务信息服务系统。万方数据资源系统涉及三个子系统,分别是科技信息子系统、商务信息子系统和数字化期刊子系统,可面向不同用户提供全面的信息服务万方的特殊数据库有:中国科技成果数据库(CSTA D)中国学位论文数据库(CDD B)中国科技论文记录与引文分析数据库(CSTPC)中国学术会议论文数据库(CACP)中国公司、公司及产品数据(CECDB)2、检索方法1 )一般检索方法专业检索2)商务信息子系统的检索则采用按行业分类逐级逼近的方法得到查询结果3)数字化期刊子系统检索方式有导航检索、简朴检索和复合检索三、维普天元数据库系统1、概况维普信息资源系统涉及:中文科技期刊全文数据库 中文科技期

47、刊文摘数据库 中文科技期刊引文库等2、中文科技期刊数据库的检索方法1)传统检索选择检索途径输入检索式选择检索词的匹配方式限定检索范围二次检索2)分类检索3)高级检索4)整刊检索四、国务院发展研究中心信息网数据库1、概况 国研报告全文数据库 宏观经济全 文 数 据 库 金融中国全文数据库 财经数据数 据 库 行业研究报告全文数据库 世界经济与金融评论数据库 高校管理决策参考数据库2、检索方法1)一般检索2)关键词检索和高级检索五、人民大学书报资料中心复印报刊资料全文数据库1、概况2、检索方法六、全国报刊索引数据库1、概况2、检索方式七、中文工具书知识库第四章外文信息资源检索第 一 节 外文传统信

48、息源的检索一、英 国 科学文摘(S A)及其检索方法1、概述2、收录范围。S A收录世界各国用各种语言写成的文献,A、B、C三辑收录文献的内容分别为A辑:重要报道世界上新近出版的有关物理学科方面的文献B辑:重要报道世界上新近出版的有关电气电子学方面的文献C辑:重要报道世界上新近出版的有关计算机与控制方面的文献3、内容编排与著录格式S A的各辑都以专业分类进行编排1)分类体系分类总表分类目次表2)文摘主体部分S A对不同文献的不同著录格式期刊论文图书会议文献科技报告3)辅助索引主题指南主题索引著者索引团队著者索引参考文献索引图书索引会议索引引用期刊目录表4、检索方法1)分类途径2)主题途径3 )

49、著者途径二、美 国 化学文摘(C A)及其检索方法1、概况:1 9 2 0 2 3创刊,是全世界化学化工文献的权威性检索工具。2、收录范围、分类及编排体例:C A文献正文是按分类编排的,1 9 6 7年至今分为5个部分,8 0个大类3、CA的索引及著录格式常用的CA检索途径关键词索引专利索引著者索引主题索引分子式索引环系索引登记号索引来源索引索引指南4、C A 的检索途径1)分类途径2)主题途径3)著者和号码途径4)分子式和环系途径三、美 国 工程索引(E I)及其检索方法1、概述:是世界上工程技术领域中著名的综合性文摘检索工具之一E I有 7 种出版形式:E I月刊E I年刊E I缩微胶卷E

50、 I检索磁带E I光盘数据库EI 网络版E I卡片2、编排体例及著录格式E I 的正文文摘编排方法和著录格式辅助索引部分,分为著者索引和主题索引E I检索途径,有主题途径、著者途径和主题索引途径四、美 国 生物学文摘(BA)及其检索方法1、概述:是目前关于生命科学的最大的一部文摘型检索工具2、BA文摘本类目表文摘正文辅助索引3、BA来源期刊目录4、生物学文摘/报告评论会议(简称。BA/RRM)BA/RRM收 录 B A 未摘录的生物学文献,涉及编辑部文章、报告、数据资料、书目、会议录、会议摘要、新书、图书的某些部分或章节、评论期刊、翻译的俄文期刊、生物命名资料等,故被称为B A 的姐妹刊五、美

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 教案示例

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁