《最新如何查找资料PPT课件.ppt》由会员分享,可在线阅读,更多相关《最新如何查找资料PPT课件.ppt(92页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、如何查找资料如何查找资料第一部分第一部分数字信息资源的概念与类型数字信息资源的概念与类型数字信息资源概述:产生与发展(续)数字信息资源概述:产生与发展(续)信息存取与检索数据库:网络数据库比例越来越大,人们为数据库检索支付费用的比例不断增加,数据库检索人次飞速增长电子期刊:出版周期短,可以检索和重复下载全文,图像与文本结合,包含有多媒体及其它类型动态信息,具备超链接功能,可以向用户主动提供期刊目次报道服务 电子图书:可以逐页阅读,并能够快速检索书中的信息 电子报纸:网上阅读其他网络学术资源:飞速发展数字信息资源概述:产生与发展(续)数字信息资源概述:产生与发展(续)电子资源现状(以北大图书馆为
2、例)数据库:370余种410多个,其中外文160种187个;覆盖北大所有重点学科电子期刊:中文9000余种20000余份(纸质期刊4000余种)西文14000余种20000余份(纸质期刊3000余种)全世界总量大于24000种除覆盖北大所有重点学科外,更在工程、能源、医学、农业等学科弥补传统资源的不足电子图书:中文18万余册,覆盖所有学科,以教学参考资料为主;另中文电子古籍:近4000部 总量近100万西文电子图书:6000余册 总量约10万电子报纸:中文近300种,外文500余种数字信息资源概述:类型数字信息资源概述:类型按性质和功能:一次文献:全文数据库、电子期刊、电子图书报纸一次文献:全
3、文数据库、电子期刊、电子图书报纸.二次文献:文摘二次文献:文摘/索引数据库、书目数据库、搜索引擎索引数据库、书目数据库、搜索引擎.三次文献:元搜索引擎三次文献:元搜索引擎按生产途径和发布范围:见见数字信息资源结构图数字信息资源结构图按载体:光盘:光盘:CACA光盘版光盘版,SCISCI光盘版光盘版网络数据库:网络数据库:CACA网络版网络版SciFinderSciFinder,WOSWOS按学科:数字信息资源概述:类型(续)数字信息资源概述:类型(续)参考数据库全文数据库事实数据库电子图书电子期刊电子报纸搜索引擎/分类指南网络学术资源学科导航FTP资源其他:网站、BBS、新闻组等数字信息资源概
4、述:类型(续)数字信息资源概述:类型(续)参考数据库(Reference database)概念:参考数据库是指包含各种数据、信息或知识的原始来源和属性的数据库。它报道文献信息的存在,揭示文献信息的内容。参考数据库信息源:期刊、报告、会议论文、专利文献、学位论文、技术标准、图书、政府出版物、报纸、各种数字资料等。数字信息资源概述:类型(续)数字信息资源概述:类型(续)参考数据类型按数据库内容划分书目数据库如图书馆的馆藏机读目录。文摘数据库如INSPEC,Chemical Abstracts,Biological Abstracts等。索引数据库如Science Citation Index,E
5、ngineering Index等。数字信息资源概述:类型(续)数字信息资源概述:类型(续)参考数据库的结构构成:参考数据库的基本组成单位为记录,而记录是由字段组成。记录(record):作为一个单位来处理的数据集合,在参考数据库中,一条记录通常指一篇特定文献。字段(field):构成记录的单元,用来描述记录的某一属性。如一般记录中包含下列字段:题目、作者、出处、关键词、主题词、文摘、题目、出版社、专利号、报告号、访问号等。数字信息资源概述:类型(续)数字信息资源概述:类型(续)参考数据库的特点综合性:数据量大,文献类型齐全,索引系统完备,语种多,出版连续性强。出版物类型:出版历史悠久,大多数
6、数据库具有对应的印刷出版物。数据库结构:结构简单,数据规范性好,记录格式固定。使用:参考数据库的使用一般是开放性的,可以购买、租用,也可联机检索。标引:多数数据库具有规范的主题标引词。文件格式:多采用文本文件格式。数字信息资源概述:类型(续)数字信息资源概述:类型(续)参考数据库的用途主要用途是搜集文献线索,快速和全面的获取某个主题、学科、领域的文献信息。用于制定个性化的用户服务,如最新目次报道、定题服务、回溯服务等。用于各类统计和评估,如统计期刊、个人或机构的发文量、文章被转载或被引用情况,评估期刊影响力等。数字信息资源概述:类型(续)数字信息资源概述:类型(续)全文数据库英文为full-t
7、ext database,即收录有原始文献全文的数据库,以期刊论文、会议论文、政府出版物、研究报告、法律条文和案例、商业信息等为主。如美国的LEXIS-NEXIS数据库、学术期刊图书馆(ProQuest Academic Research Library)及中国人民大学书报资料中心复印报刊资料全文数据库等。数字信息资源概述:类型(续)数字信息资源概述:类型(续)事实数据库英文为factual database,指包含大量数据、事实,直接提供原始资料的数据库,又分为数值数据库(numeric database)、指南数据库(directory database)、术语数据库(terminolog
8、ical database)等,相当于印刷型文献中的字典、辞典、手册、年鉴、百科全书、组织机构指南、人名录、公式与数表、图册(集)等。数值数据库,指专门以数值方式表示数据,如统计数据库、化学反应数据库等;指南数据库,如公司名录、产品目录等;术语数据库,即专门存储名词术语信息、词语信息等的数据库,如电子版百科全书、网络词典等。数字信息资源概述:类型(续)数字信息资源概述:类型(续)电子期刊英文为electronic journals或简称e-journal,包括:与纸本期刊并行的电子期刊,如著名的科学(Science)、自然(Nature)、Elsevier/Wiley/Springer/Klu
9、wer等出版商的电子期刊、中国电子期刊杂志社的期刊等;纯电子期刊,如数字图书馆杂志(D-Lib Magazine)数字信息资源概述:类型(续)数字信息资源概述:类型(续)电子图书英文为electronic books,最初的电子图书主要以百科全书、字典词典等工具书为主,但近年来发展迅速,已涉及到了很多学科领域,文学作品、学术专著所占比例越来越大,电子图书正在逐步发展成为比较主要的数字信息资源 如国外的NetLibrary、Ebrary;国内的超星数字图书馆、书生之家电子图书、方正Apabi数字图书馆等数字信息资源概述:类型(续)数字信息资源概述:类型(续)电子报纸英文为electronic n
10、ewspaper,目前网上已有数千种报纸供用户使用。同电子期刊一样,电子报纸同样也有印刷型报纸的电子版和纯电子报纸两种类型电子报纸全文检索系统如人民日报等;全文数据库中的电子报纸如ABI、lexis、中国资讯行全文数据库等;还有网上免费的电子报纸(印刷型报纸的电子版);纯电子报纸如圣何塞信使报 数字信息资源概述:类型(续)数字信息资源概述:类型(续)搜索引擎/分类指南英文为search engine,是目前利用互联网开放信息的常用工具,也可以称得上是互联网开放信息的索引目录。搜索引擎主要是使用一种计算机自动搜索软件,在互联网上检索,将检索到的网页编入数据库中,并进行一定程度的自动标引,用户使用
11、时输入检索词,搜索引擎将其与数据库中的信息匹配,然后产生检索结果。例如常用的Yahoo、Hotbot、Alta Vista、Excite、Google、天网、悠游等。分类指南是将搜索到的网页按主题内容组织成等级结构(主题树),用户按照这个目录逐层深入,直到找到所需文献。通常搜索引擎与分类指南是结合在一起的,例如Yahoo、新浪、悠游等 数字信息资源概述:类型(续)数字信息资源概述:类型(续)网络学术资源学科分类导航将互联网上的开放信息加以甄别、筛选和科学整理,按学科组织起来,构成完整的学科导航系统,为教学、科研、技术人员提供各类学术信息。与搜索引擎/分类指南不同的是,网络学术资源的学科导航库通
12、常是由图书馆单独或联合建设的。例如CSDL的学科信息门户http:/数字信息资源概述:类型(续)数字信息资源概述:类型(续)FTP资源FTP含义是File Transfer Protocol,意为文件传送协议,是互联网上最早应用的协议之一,它可以使用户远程登录到远端计算机上,把其中的文件传回到自己的计算机上,或把自己计算机上的文件上传到远端计算机系统上。所谓FTP资源,是指互联网上的开放FTP站点,这些站点允许用户登录上去,从中下载各类数据、资料、软件等。可以利用FTP搜索引擎查找FTP资源,例如北大天网文件引擎http:/第二部分第二部分数字信息资源的检索数字信息资源的检索数字信息资源检索:
13、检索系统数字信息资源检索:检索系统检索系统检索系统检索系统构成检索系统评价联机数据库检索联机数据库检索光盘数据库检索光盘数据库检索网络数据库检索网络数据库检索检索语言检索语言相关的网络基础知识相关的网络基础知识数字信息资源检索:检索系统(续)数字信息资源检索:检索系统(续)检索系统构成物理构成硬件(hardware):也可以说是硬件环境,是和计算机检索有关的各种硬件设备的总称,如大型计算机主机(服务器)、存储器(硬盘或光盘)、网络(广域网、局域网、存储区域网)、输入输出设备(键盘、打印机、鼠标等)、计算机终端或个人计算机(PC)等。软件(software):与计算机检索相关的数据库系统软件及相
14、关应用软件。包括:信息采集、存储、信息标引加工、建库、词表管理、用户检索界面、提问处理、网络发布、数据库管理等模块。随着网络和计算机技术的发展,软件的开发平台、程序语言的持续升级,用户功能需求的增加,这一部分的具体结构也在不断发生变化。数字信息资源检索:检索系统(续)数字信息资源检索:检索系统(续)检索系统构成物理构成(续)数据库(database):数据库是指按一定方式、以数字形式存储、可通过计算机存取、相互关联的数据集合。数据库的特点是:重复数据少;可以共享数据资源,以最优的方式为一个或多个应用服务;数据具有独立性,其存放独立于应用程序之外。由于数据库中的信息都经过了详细、精心的选择和加工
15、,主题化,有序,能够提供多种检索途径,因此相对互联网上无组织和大量无用的信息来说,检索结果准确,时间少,价值高。从发展的角度看,以网络为中心的分布式数据库系统是今后的发展趋势。数字信息资源检索:检索系统(续)数字信息资源检索:检索系统(续)检索系统构成功能划分信信息息采采集集模模块块(collection):本模块的任务是连续、快速地采集各类信息,为数据库提供充足的数据来源。信信息息存存储储模模块块(repositories):存储介质包括磁带、磁盘、光盘。从根本上讲,存储方式决定了应用方式,存储方案决定了整个系统的的扩展性和灵活性。标标引引著著录录模模块块(description):即对信息
16、的内容和特征进行分析,然后给予一定数量的标识,作为信息组织、存储与检索的基础。例如信息的名称、创作者、主题、分类、出版/生产时间、出版/生产者、关键词等,都可以作为信息的描述性标识。数字信息资源检索:检索系统(续)数字信息资源检索:检索系统(续)检索系统构成功能划分(续)规规范范模模块块(authorities):指对信息特征和用户提问的语言形式做出规定,如主题词表、人名规范、地名规范、时代名称规范等,目的在于,一是使用户的检索更具准确性;二是逐步形成一个知识网络,通过相关信息的提供,使用户的检索更为完整。内内容容发发布布模模块块(publish):将数据库内容传递到网络上,让用户以常规手段(
17、如通过浏览器)查询浏览。数字信息资源检索:检索系统(续)数字信息资源检索:检索系统(续)检索系统构成功能划分(续)检检索索模模块块(access):也就是狭义理解的检索系统,即将用户的需求进行分析,并和数据库中的信息匹配运算,再反馈给用户所需的检索结果。检索界面:即人-机接口;检索功能:如简单检索、复杂检索、浏览、图象检索等;检索途径:如题名、作者、主题、文摘等检索入口;检索技术:如布尔逻辑、组配检索、截词符、词根检索、位置算符等;检索结果:打印、存盘、结果格式、二次检索;提问处理:也可称匹配运算,即处理和运算用户的检索式。数字信息资源检索:检索系统(续)数字信息资源检索:检索系统(续)检索系
18、统构成功能划分(续)服服务务模模块块(services):这是在传统检索系统基础上发展起来的新功能,如最新目次报道服务、文献传递服务,虚拟咨询服务等。管管理理模模块块(administration):主要指管理客户端,即对用户和用户行为进行管理和调查分析。主要包括三个部分,一是对用户的管理;二是运用数学和统计学方法,对用户行为的各种相关信息进行累积、加工、分析,生成各种状态报告,提供给数据库生产者、系统开发者和用户,以便对数据库及其系统进行修改、完善,使其不断得到提高;三是监控系统使用情况,如观察用户有无违反版权规定、恶意下载(abuse)现象,并对违法用户进行相应处罚。数字信息资源检索:检索
19、系统(续)数字信息资源检索:检索系统(续)检索系统评价主要评价指标检检索索功功能能:指系统提供给用户的各种检索途径和检索入口。检检索索技技术术:即系统是否允许用户使用各种检索技巧,以便更准确和快速地找到自己所需信息。检检索索结结果果:即用户是否得到了内容全面、下载和使用均比较方便的检索结果,例如显示格式包含的内容是否全面;检索结果数量较多时是否允许在翻页的同时标记记录;是否提供存盘、打印、email发送等多种下载功能;检索结果是否与其它资源之间存在链接,为用户提供查找到其它资源的捷径等。用用户户服服务务:主要是指在检索功能之外,系统还为用户提供了哪些服务。数字信息资源检索:联机检索数字信息资源
20、检索:联机检索联机检索(online retrieval)是指用户利用计算机终端设备,通过通信线路或网络,在联机检索中心的数据库中进行检索并获得信息的过程。数字信息资源检索:光盘检索数字信息资源检索:光盘检索联机光盘检索是指把单用户系统发展成多用户的局域网系统,通过网络(如校园网)连接多个用户终端,用服务器管理多组光盘数据库及其检索系统 数字信息资源检索:网络数据库检索数字信息资源检索:网络数据库检索网络数据库(web-database)检索是指用户在自己的客户端上,通过互联网和浏览器界面对数据库进行检索,是基于互联网的分布式特点开发和应用的数字信息资源检索:检索语言数字信息资源检索:检索语言
21、检索语言的概念与作用检索语言(information retrieval language),是信息存储与检索过程中用于描述信息特征和表达用户信息提问的一种专门语言。所谓检索的运算匹配就是通过检索语言的匹配来实现的。检索语言是人与检索系统对话的基础。检索语言作用示例检索语言作用示例已知3篇文献的篇名,在对信息存储的过程中,对这三篇文献内容分别进行了分析,并使用检索语言对其进行标引,标引结果为:文 献 1:篇 名(title):A model of multimedia information retrieval 主 题(subject):information retrieval,multim
22、edia computer applications文献2:篇名(title):The Information retrieval in chemistry WWW server 主题(subject):chemistry,educational materials文献3:篇名(title):ERIC resources 主题(subject):Educational materials标引后这三篇文献分别被存储进数据库。信息检索过程:检索语言及标识匹配。检索语言作用:对文献的外部特征和内容进行多层次描述,提供多种检索途径,以方便用户从不同角度检索。数字信息资源检索:检索语言(续)数字信息资源
23、检索:检索语言(续)检索语言类型人工语言人工语言:人工语言(artificial language)是根据信息检索的需要而由人工创制的,采用规范词(controlled term),用来专指或网罗相应的概念,可以将同义词、近义词、相关词、多义词及缩略词规范在一起,由人工控制,包括分类检索语言(分类号)主题检索语言:标题词、单元词、叙词代码检索语言数字信息资源检索:检索语言(续)数字信息资源检索:检索语言(续)检索语言类型人工语言(续)分类检索语言:按照学科范畴及知识之间的关系列出类目,并用数字、字母符号对类目进行标识的一种语言体系,也称分类法。使用这种检索语言建立的信息检索系统可以反映知识的从
24、属、派生、重合、交叉、并列等关系,用户因此可以鸟瞰全貌、触类旁通,系统地掌握和利用一个学科或专业范围的知识和信息。目前常用的分类法有中国图书馆图书分类法(简称中图法)、美国国会图书馆分类法、杜威分类法、国际专利分类表等。数字信息资源检索:检索语言(续)数字信息资源检索:检索语言(续)检索语言类型人工语言(续)主题检索语言:由主题词汇构成,即将自然语言中的名词术语经过规范化后直接作为信息标识,按字母顺序排列标识,通过参照系统揭示主题概念之间的关系,也称主题法。主题语言表达的概念比较准确,具有较好的灵活性和专指性,不同的检索系统、不同的专业领域可以有各自的主题词表。标题词语言(subject he
25、ading):是一种先组式的规范词语言,即在检索前已经将概念之间的关系组配好。具有较好的通用性、直接性和专指性,灵活性较差。常用的标题词表有美国国会标题词表(Library of Congress Subject)、医学主题词表(Medical Subject Headings)。数字信息资源检索:检索语言(续)数字信息资源检索:检索语言(续)检索语言类型人工语言(续)主题检索语言(续):单元词(元词法,uniterm):是一种最基本的、不能再分的单位词语,亦称元词,从文献内容中抽出,再经规范,能表达一个独立的概念。例如“信息检索”是一个词组,“信息”和“检索”才是单元词。叙词(叙词法,des
26、criptor):是计算机检索中使用较多的一种语言,可以用复合词来表达主题概念,在检索时可由多个叙词形成任意合乎逻辑的组配,形成多种组合方式。由叙词组成的词表叫叙词表(thesaurus)。数字信息资源检索:检索语言(续)数字信息资源检索:检索语言(续)检索语言类型人工语言(续)代码检索语言就事物的某一方面特征,用某种代码系统来加以标引和排列,目前主要应用于化学领域。例如,化合物的分子式索引系统,环状化合物的环系索引系统等。此外,如DII专利代码索引,BP的concept code list数字信息资源检索:检索语言(续)数字信息资源检索:检索语言(续)检索语言类型自然语言自然语言(natur
27、al language)检索用词是从信息内容本身抽取的,主要依赖于计算机自动抽词技术完成,辅以人工自由标引(非依据词表的标引方法),是非规范词(uncontrolled term)。自然语言标识包括关键词(keyword):直接从信息资源名称、正文或文摘中抽出的代表信息主要内容的重要语词。题名:信息资源的名称,如论文篇名、图书书名、网站名称等。全文:从资源的全部内容中自动抽取、查找,是目前网上各类搜索引擎使用的最多的方法。引文:将文献所引用的参考文献的作者、篇名、来源出版物抽取出来进行标引。此外还有责任者(作者)、摘要等。数字信息资源检索:检索语言(续)数字信息资源检索:检索语言(续)检索语言
28、类型人工语言和自然语言的关系成熟的检索系统中,两种语言并用主题词和关键词人工语言和自然语言正在不断融合,形成一种新的知识体系NKOS(Networked knowledge organization systems/schemes/services)。它融合了叙词表、标题词表、语义网络、分类体系的功能,得到了普遍关注,并开始在各类数据库、搜索引擎以及知识管理方面应用,例如Yahoo、Google的主题分类指南,以及许多企业门户网站的分类索引服务即是NKOS体系应用的雏形。数字信息资源检索:相关基础知识数字信息资源检索:相关基础知识关于网络互联网:Internet(现在译为因特网),是世界上最大
29、的计算机互联通信网络,最早起源于美国国防部的计算机网络ARPAnet。它本身不是一种具体的物理网络,而是一种虚拟的计算机网络。互联网络实际上是把全世界各个地方已有的各种网络,如计算机网络、数据通信网以及公用电话交换网等通过TCP/IP协议相互联结,组成一个跨越国界的庞大的综合网络 广域网(Wide Area Network WAN):分布距离大于50公里,可以覆盖多个单位或多个国家,如我国的Chinanet、CERnet等。局域网(Local Area Network LAN):分布距离在10公里范围内,通常为某个单位专用,如北京大学校园网等。具有结构简单、投资少、数据传输速度快、可靠性好、保
30、密性强等特点。数字信息资源检索:相关基础知识数字信息资源检索:相关基础知识关于网络技术与结构服务器server网卡SCSI路由器router:路由器是一种连接多个网络或网段的网络设备,它能将不同网络或网段之间的数据信息进行“翻译”,以使它们能够相互“读”懂对方的数据,从而构成一个更大的网络网关gateway:网关实质上是一个网络通向其他网络的IP地址。数字信息资源检索:相关基础知识数字信息资源检索:相关基础知识关于网络传输TCP/IP协议客户端/服务器client/server域名(domain name)与主机(host)IP地址与IP范围ISP:Internet Service Provi
31、derICP:Internet Content Provider调制解调器(modem)数字信息资源检索:相关基础知识数字信息资源检索:相关基础知识关于网络资源的应用与检索万维网WWW浏览器:Netscape或Internet ExplorerFTP:File Transfer Protocol超文本文件HTML file超文本传输协议http统一资源定位器URL主页homepage电子邮件email新闻组newsgroup(usenet)搜索引擎search engine第三部分第三部分数字信息资源的数字信息资源的检索方法和检索技术检索方法和检索技术数字信息资源检索方法数字信息资源检索方法/
32、技术技术检索方法(详见第四讲)课题分析选择信息源构造检索策略调整检索策略检索结果评价数字信息资源检索方法数字信息资源检索方法/技术(续)技术(续)检索功能浏览:由系统提供一个树状结构的概念等级知识体系,用户可以沿着这颗“树”进入不同的分支,到达叶子节点,并在节点看到检索结果列表。索引:提供一个线性的表单,可以将任何一个标引字段中的概念按字母顺序线性排列起来,不分等级。例如:人名索引、出版物索引、地名索引、主题索引、机构索引等。数字信息资源检索方法数字信息资源检索方法/技术(续)技术(续)中文科技期刊库的浏览中文科技期刊库的浏览中文科技期刊全文数据库提供了中文科技期刊全文数据库提供了中刊库学科导
33、航和刊名导航,中刊库学科导航和刊名导航,以便用户进行不同角度的浏览需以便用户进行不同角度的浏览需求。分类导航按照中国图书资求。分类导航按照中国图书资料分类法的标准,逐层进行分料分类法的标准,逐层进行分类限制。如用户选中选中某类目,类限制。如用户选中选中某类目,则检索结果包括此类目下的全部则检索结果包括此类目下的全部数据库。例如数据库。例如“图书情报图书情报”是一是一级类目,级类目,“图书馆学、图书馆事图书馆学、图书馆事业业”是二级类目,而是二级类目,而“读者工作读者工作”为三级类目。左图标识是书本,为三级类目。左图标识是书本,表示该类目还有下位类,而表示该类目还有下位类,而标标识是页面,表示该
34、类目是终端类识是页面,表示该类目是终端类目。目。数字信息资源检索方法数字信息资源检索方法/技术(续)技术(续)ProQuest系统提供了四种索引:主题(系统提供了四种索引:主题(subjects)、)、公司(公司(companies)、)、人名人名(people)和地名(和地名(locations),),分别取自于主题词、公司名称、个人名称和地理分别取自于主题词、公司名称、个人名称和地理名称四个标引字段。选择任一索引后,输入任意想要查找的词汇甚至若干字母,系统名称四个标引字段。选择任一索引后,输入任意想要查找的词汇甚至若干字母,系统会按右截断的方式显示在这之后的所有词汇,供用户查看。也可以直接
35、点击检索界面会按右截断的方式显示在这之后的所有词汇,供用户查看。也可以直接点击检索界面上方的上方的26个字母,按字母顺序翻看。索引工具最适于用户查找拼法相近的一组词汇,个字母,按字母顺序翻看。索引工具最适于用户查找拼法相近的一组词汇,记不住拼写时也可以使用这种方法。记不住拼写时也可以使用这种方法。实例:实例:ProQuest系统的索引体系系统的索引体系数字信息资源检索方法数字信息资源检索方法/技术(续)技术(续)检索功能(续):简单检索:为用户提供一个简单的检索界面,页面上通常只有一个检索框。复杂检索/高级检索:为专业用户、资深用户提供的比较复杂的检索界面,可以构建比较细致的检索式,帮助用户进
36、行精确检索。专家检索:构建专业的检索策略进行检索二次检索:在检索结果内进一步检索,使检索结果更精练、准确。实例:实例:Kluwer简单检索和复杂检索界面简单检索和复杂检索界面简单检索提供一个检索条件输入框和简单检索提供一个检索条件输入框和选择检索字段的下拉框。检索字段包选择检索字段的下拉框。检索字段包括全面、篇名、作者、文摘和刊名括全面、篇名、作者、文摘和刊名5个个检索入口。同时,可以通过限制出版检索入口。同时,可以通过限制出版日期、限制文献种类,可以把检索结日期、限制文献种类,可以把检索结果限制在一定范围内,从而达到快速果限制在一定范围内,从而达到快速查准的目的。查准的目的。复杂检索提供多个
37、检索条件输入框,可复杂检索提供多个检索条件输入框,可以输入一个检索条件进行简单检索或输以输入一个检索条件进行简单检索或输入多个检索条件实现多个检索字段的组入多个检索条件实现多个检索字段的组合检索。检索字段比简单检索增加了合检索。检索字段比简单检索增加了ISSN、关键词和作者单位。与简单检索关键词和作者单位。与简单检索最大不同的是,复杂检索可以提供提供最大不同的是,复杂检索可以提供提供的逻辑算符(的逻辑算符(AND.OR.NOT)进行组配)进行组配检索。检索。数字信息资源检索方法数字信息资源检索方法/技术(续)技术(续)数字信息资源检索方法数字信息资源检索方法/技术(续)技术(续)检索功能(续)
38、自然语言检索:检索系统在检索界面上提供的自然语言检索,指的是用户可以直接输入一句话,就象对人谈话一样。例如:hurricanes in the Atlantic and Pacific(大西洋和太平洋的飓风)How does El Nino affect weather?(厄尔尼诺现象是怎么影响气候的?)到目前为止,限于计算机智能检索技术的发展,尚没有检索系统能够提供很好的自然语言检索功能,因此这方面的功能尚不具备查全查准的实用效果。数字信息资源检索方法数字信息资源检索方法/技术(续)技术(续)检索技术布尔逻辑检索位置算符检索截词检索与词根检索字段检索全文检索其他检索技术:嵌套、限制、大小写敏
39、感、嵌套、限制、大小写敏感、禁用词禁用词数字信息资源检索方法数字信息资源检索方法/技术(续)技术(续)逻辑逻辑“与与”(and):):检索时,命中信息同时含有两个概念,专指性检索时,命中信息同时含有两个概念,专指性强;强;逻辑逻辑“或或”(or):):检索时,命中信息包含所有关于逻辑检索时,命中信息包含所有关于逻辑A或逻辑或逻辑B或同时有或同时有A和和B的,检索范围比的,检索范围比and扩大。扩大。逻辑逻辑“非非”(not):):命中信息只包括逻辑命中信息只包括逻辑A,不包括逻辑不包括逻辑B或同时有或同时有A和和B的,排除了不需要的检索词。的,排除了不需要的检索词。逻辑逻辑“异或异或”(xor
40、):):命中信息包含逻辑命中信息包含逻辑A,也包含逻辑也包含逻辑B,但不包但不包含同时含有含同时含有A和和B的信息。的信息。检索技术布尔逻辑检索:检索技术布尔逻辑检索:运用布尔逻辑算符(运用布尔逻辑算符(Boolean Boolean operatorsoperators)对检索词进行逻辑对检索词进行逻辑组配,表达两个概念之间的逻组配,表达两个概念之间的逻辑关系。辑关系。数字信息资源检索方法数字信息资源检索方法/技术(续)技术(续)检索技术布尔逻辑检索(续)在不同的检索系统里,布尔逻辑的运算次序是不同的,因此会导致检索结果的不同。通常运算次序有这样几种形式:一是按算符出现的顺序,如果是and、
41、or、not,就按and、or、not的顺序运算;如果是or、not、and,就按or、not、and的顺序运算;二是默认and优先运算,其次是or、not;三是默认or优先运算,然后是and、not。一般来讲,检索系统的“帮助”文件中都会有这类说明,只要注意查看即可。在中文数据库里,布尔逻辑运算符有时用and、or、not下拉菜单形式表示,供用户选择;有时用“*”号表示逻辑“与”,用“+”表示逻辑“或”,用“-”表示逻辑“非”。数字信息资源检索方法数字信息资源检索方法/技术(续)技术(续)检索技术位置算符(position)检索:即运用位置算符(position operators)表示两个
42、检索词间的位置邻近关系,又叫邻接检索(proximity)。这种检索技术通常只出现在西文数据库中,在全文检索中应用较多。如果说布尔逻辑算符是表示两个概念之间的逻辑关系的话,位置算符表示的是两个概念在信息中的实际物理位置关系。数字信息资源检索方法数字信息资源检索方法/技术(续)技术(续)检索技术位置算符检索(续)With(field):same field or same sequenceNear:same sentencePre(precede):library pre science library science,library with science,.w/n(Within):libr
43、ary w/n science library science,science library,Field:same fieldSame:same paragraph数字信息资源检索方法数字信息资源检索方法/技术(续)技术(续)检索技术位置算符检索(续)常用的位置算符算符算符 功能功能 表达式表达式 检索结果检索结果 W,W/N withwithin 两两词词相相邻邻,按按输输入入时时顺顺序序排排列列(也有数据库(也有数据库允许顺序颠倒)允许顺序颠倒)Education(W)school,或或Education with school Education schoolEducation sch
44、ools(school of educationschools of education)nW 同同上上,两两词词中中间间允允许许插插入入n个词个词Education(1W)school Education schoolEducation schoolsEducation and music schoolSchool of continued education Pre 两词相邻,按两词相邻,按输入顺序排列输入顺序排列 Education Pre school Education schoolEducation schools 数字信息资源检索方法数字信息资源检索方法/技术(续)技术(续)算符
45、算符 功能功能 表达式表达式 检索结果检索结果 N,near,adj 两两词词相相邻邻,顺顺序序可可以以颠颠倒倒 Education(N)school,或或Education near school Education schoolEducation schoolsSchool of education nN 同同上上,两两词词中中间间可可以以插插入入n个词个词 Education(1N)school Education schoolSchool of educationEducation and music school F 两个词同在两个词同在一个标引字一个标引字段中段中Education
46、(F)school例如同时出现在题名或文摘字段中例如同时出现在题名或文摘字段中Same 两个词同在两个词同在一个段落一个段落(paragraphparagraph)中中 Education Same school 同时出现在一个段落中同时出现在一个段落中检索技术位置算符检索(续)常用的位置算符(续)数字信息资源检索方法数字信息资源检索方法/技术(续)技术(续)检索技术位置算符检索(续)不是每一个检索系统都使用上述位置算符,不同的系统使用的位置算符不同,不同的算符在不同的系统中有时可能含义不同。例如“W”算符,在Dialog检索系统表示两词相邻,输入顺序不变;在ProQuest系统中,“W”算符
47、表示输入的两个词相邻,但顺序可变,如顺序要求不变,则使用“Pre”算符。用户可以查阅help帮助文档说明。数字信息资源检索方法数字信息资源检索方法/技术(续)技术(续)检索技术截词检索截词检索:用截词符号“?”、“*”或“$”加在检索词的前后或中间,以检索一组概念相关或同一词根的词。这种检索方式可以扩大检索范围,提高查全率,主要用于西文数据库检索。中文数据库通常不使用这种技术。截词检索类型截词方式根据截词的位置不同,分为前截断、后截断、中截断;根据截断的数量不同,分为有限截断和无限截断。数字信息资源检索方法数字信息资源检索方法/技术(续)技术(续)检索技术截词检索(续)后截断:是前方一致检索,
48、又称右截断,截词符放在被截词的右边,是最常用的截词检索技术。后截断主要用于下列检索:词的单复数检索,如company与companies;年代检索,如199?(九十年代);词根检索,如socio*,可以检索sociobiology,socioecology,sociology等20多个词汇。前截断:截词符放在被截词的左边,可与后截断一同使用。例如输入*magnetic,可检electro-magnetic、electromagnetic、thermo-magnetic等。目前这种检索技术应用已经极少。中截断:把截词符放在词的中间。如organi?ation,可检索organisation、or
49、ganization。这种方式查找英美不同拼法的概念最有效。数字信息资源检索方法数字信息资源检索方法/技术(续)技术(续)检索技术截词检索(续)举例符号:*,?,$后截断:librar*library,libraries,librarian,前截断:*magnetic magnetic,electro-magnetic,electromagnetic,thermo-magnetic,中截断:organi?ation organization,organisation数字信息资源检索方法数字信息资源检索方法/技术(续)技术(续)检索技术截词检索(续)截词类型:根据截断的数量不同,分为有限截断和无
50、限截断。无限截断:不限制被截断的字符数量,例如输入educat?,可以检索educator,educators,educated,educating,education,educational,等等。有限截断:限制被截断的字符数量,例如输入educat*,表示被截断的字符只有两个,可以检索educator,educated两个词。数字信息资源检索方法数字信息资源检索方法/技术(续)技术(续)检索技术词根检索有些检索系统不支持使用截词符的截词检索技术,系统默认的是词根检索,即输入一个词,系统会自动检索出同一词根的一组词,例如输入gene,可以检索出gene,genic,genome等。这是一种智