《文献检索信息检索技术.pptx》由会员分享,可在线阅读,更多相关《文献检索信息检索技术.pptx(29页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、1第二部分 计算机信息检索技术2.1 布尔逻辑检索(Boolean Logic)2.2 位置检索(Position Search)2.3 截词检索(Truncation)2.4 字段限定检索(Field Limiting)2.5 短语检索(Phrase Search)2.6 自然语言检索(Natural Language Search)第1页/共29页22.1 布尔逻辑检索布尔逻辑检索(Boolean Logic)第二部分 计算机信息检索技术(1)逻辑“与”算符:用 AND 或*表示;A概念和B概念的“与”关系表示为:A AND B A and B A*BA AND BAB第2页/共29页32
2、.1 布尔逻辑检索布尔逻辑检索(Boolean Logic)第二部分 计算机信息检索技术(2)逻辑“或”算符:用 OR 或+表示;A概念和B概念的“或”关系表示为:A OR B A or B A+BA OR BAB第3页/共29页42.1 布尔逻辑检索布尔逻辑检索(Boolean Logic)第二部分 计算机信息检索技术(3)逻辑“非”算符:用 NOT 或-表示;A概念和B概念的“非”关系表示为:A NOT B A not B A-BA NOT BAB第4页/共29页52.1 布尔逻辑检索布尔逻辑检索(Boolean Logic)第二部分 计算机信息检索技术(4)运算符的优先级运算 顺序如下:
3、()NOTANDOR。(A OR B)AND CABC例如:(激光器 OR 调制器)AND 制备方法,先进行括号内的检索,然后再将其检索结果与制备方法组配,目的是检索激光器或者调制器的制备方法。第5页/共29页62.2 位置检索位置检索(Position Search)第二部分 计算机信息检索技术也叫邻近检索(Proximity Search)定义:位置算符检索是用一些特定的算符(位置算符)来表达检索词与检索词之间的邻近关系。目的:用于确定词语的相对次序或位置。举例:computer aided design顺序间隔第6页/共29页72.2 位置检索位置检索(Position Search)第
4、二部分 计算机信息检索技术美国DIALOG检索系统的位置算符的用法:(1)(W)With(W)表示该算符两侧的检索词相邻,且两者之间只允许有一个空格或标点符号,不允许有任何字母或词,顺序不能颠倒。(W)也可以简写为()。检 索 式:information()retrieval检索结果:information retrieval检 索 式:computer()aided()design检索结果:computer aided design 第7页/共29页82.2 位置检索位置检索(Position Search)第二部分 计算机信息检索技术美国DIALOG检索系统的位置算符的用法:(2)(nW)
5、nWords(nW)表示在此算符两侧的检索词之间最多允许间隔n个词(实词或虚词),且两者的相对位置不能颠倒。检 索 式:laser(1W)printer检索结果:laser printer laser color printer第8页/共29页92.2 位置检索位置检索(Position Search)第二部分 计算机信息检索技术美国DIALOG检索系统的位置算符的用法:(3)(N)Near(N)表示该算符两侧的检索词相邻,但两者的相对位置可以颠倒。检 索 式:computer(N)network 检索结果:computer network network computer第9页/共29页10
6、2.2 位置检索位置检索(Position Search)第二部分 计算机信息检索技术美国DIALOG检索系统的位置算符的用法:(4)(nN)nNear(nN)表示此算符两侧的检索词之间允许间隔最多n个词,且两者的顺序可以颠倒。检 索 式:computer(2N)system 检索结果:computer system computer code system computer aided design system system using modern computer 第10页/共29页112.2 位置检索位置检索(Position Search)第二部分 计算机信息检索技术美国DIALO
7、G检索系统的位置算符的用法:(5)(S)Subfield(S)表示其两侧的检索词必须是在文献记录的同一子字段中,而不限定它们在该子字段中的相对次序和相对位置的距离。在文摘字段中,一个句子就是一个子字段。检 索 式:computer()control(S)system检索结果:“This paper is concerned with an application of the computer control technique in a intelligent system for testing inner walls of pipes.”第11页/共29页122.2 位置检索位置检索(P
8、osition Search)第二部分 计算机信息检索技术美国DIALOG检索系统的位置算符的用法:(6)(F)Field(F)表示其两侧的检索词必须是在文献记录的同一字段中,而它们在该字段中的相对次序和相对位置的距离不限。例如:water()pollution(F)control 表示在同一个字段中(如篇名、文摘、叙词等)同时含有 water pollution 和 control的文献记录均可检索出来。第12页/共29页132.2 位置检索位置检索(Position Search)第二部分 计算机信息检索技术Ei Village检索系统中的位置算符(只有一种):(N)Near (N)表示两
9、个检索词彼此接近且两词之间最多不超过5个词,前后顺序不限。例如:water()pollution(F)control表示在同一个字段中(如篇名、文摘、叙词等)同时含有 water pollution 和 control的文献记录均可检索出来。第13页/共29页142.2 位置检索位置检索(Position Search)第二部分 计算机信息检索技术CSA Illumina检索系统中的位置算符:词间无算符,即表示将检索词作为一个词组来检索;WITHIN“x”,表示在指定的半径内(x个词)查找输入词,词序不限;NEAR,设定在相距不大于10个词的范围内查找输入词,相当于within 10;BEFO
10、RE,按照输入检索词相应的顺序查找;AFTER,按照第1个词在第2个词之后的相应顺序查找。第14页/共29页152.2 位置检索位置检索(Position Search)第二部分 计算机信息检索技术IEL检索系统中的位置算符:paragraph,表示算符两边的检索词必须出现在同一段落内,两个检索词的顺序可以前后颠倒;sentence,表示算符两边的检索词必须出现在同一句子内,两个检索词的顺序可以前后颠倒;,表示算符两边的检索词必须出现在同一短语内,两个检索词的顺序可以前后颠倒;,表示两个检索词相邻,中间相隔最多n个词,两个检索词的顺序可以前后颠倒。第15页/共29页162.3 截词检索截词检索
11、(Truncation)第二部分 计算机信息检索技术截词检索是计算机检索系统中应用非常普遍的一种技术。由于西文的构词特性,在检索中经常会遇到名词的单复数形式不一致;同一个意思的词,英美拼法不一致;词干加上不同性质的前缀和后缀就可以派生出许多意义相近的词等。为了保证查全,就得在检索式中加上这些具有各种变化形式的相关意义的检索词,这样就会出现检索式过于冗长,输入检索词的时间太久,同时也占太多机时。第16页/共29页172.3 截词检索截词检索(Truncation)第二部分 计算机信息检索技术截词检索就是为了解决这个问题而设计的,它既可保证不漏检,又可节约输入检索式的时间。所谓截词,就是指在检索词
12、的适当位置截断,保留相同的部分,用相应的截词符代替可变化部分,计算机会将所有含有相同字符部分词的记录全部检索出来。第17页/共29页182.3 截词检索截词检索(Truncation)第二部分 计算机信息检索技术 美国Dialog系统用“?”表示截词符,有以下几种截词方式。(1)后方截词 后方截词,也称前方一致。它是将截词符放在一串字符的后面,用以表示以相同字符串开头,而结尾不同的所有词。后方截词又分为词尾的有限截断和词尾的无限截断两种情况。第18页/共29页192.3 截词检索截词检索(Truncation)第二部分 计算机信息检索技术 美国Dialog系统用“?”表示截词符,有以下几种截词
13、方式。(1)后方截词 词尾的有限截断相同字符串后可能变化一个字符时,则在其后使用一个“?”、空格、再加一个“?”,常用来表示检索词的单复数变化。例如用system?可以查出system和systems的文献。相同字符串后可能变化两个以上字符时,则在其后连续使用若干个“?”代替可能变化的字符。例如,?表示两个字符,?表示三个字符,以此类推。第19页/共29页202.3 截词检索截词检索(Truncation)第二部分 计算机信息检索技术 词尾的无限截断相同字符串后可能变化任何字符串时,则在其后使用一个“?”。这种方法可以查找出含有相同字符串的所有检索词。例如,comput?可查出 compute
14、,computer,computing,computation,computerisation等。第20页/共29页212.3 截词检索截词检索(Truncation)第二部分 计算机信息检索技术(2)中间截词 中间截词又称中间屏蔽,是一种用截词符屏蔽词中不同字符的方法。例如“woman”和“women”,可用“wom?n”代替;“defence”和“defense”可用“defen?e代替。截词符具有“OR”运算符的功能,能够扩大检索范围,而且减少了输入检索词的时间,节约了机时。常用的截词符有?”、“*”,、“”、“”等多种表示形式,不同的检索系统其截词符的表示形式和截词检索的方式是不同的,
15、第21页/共29页222.3 截词检索截词检索(Truncation)第二部分 计算机信息检索技术例如:输入optic*,可检索出optic,optics,optical等;“?”用于词中表示可以代替一个字符,例如,输入wom?n可检索出woman,women.Ei Village中的截词符为:“*”用于词中或词后表示可以代替多个字符,检索出相同词干的任意多个变化的词:第22页/共29页232.4 字段限定检索字段限定检索(Field Limiting)第二部分 计算机信息检索技术字段限定检索是指限定检索词在数据库记录中的一个或几个字段范围内查找的一种检索方法。在检索系统中,数据库设置的可供检
16、索的字段通常有两种:表达文献主题内容特征的基本索引字段和表达文献外部特征的辅助索引字段。基本索引字段包括篇名、文摘、叙词、自由标引词四个字段;辅助索引字段包括除基本索引字段以外的所有字段,像著者字段、著者机构字段、文献类型字段、语种字段等。每个字段都有用2个字母表示的字段标识符(或称字段代码)。第23页/共29页242.4 字段限定检索字段限定检索(Field Limiting)第二部分 计算机信息检索技术在DIALOG检索系统的命令检索模式中,使用字段限制检索时,基本索引字段用后缀表示,即由“”与基本索引字段标识符组成,放在检索词或检索式的后面,例如,computer and net-wor
17、k/TI,DE表示将检索式限定在篇名字段(TI)和叙词字段(DE)中;辅助索引字段用前缀表示,即由辅助索引字段标识符与“=”组成,放在检索词或检索式的前面,例如,要查找著者Smith D.发表的文献,检索式可表示为AU=Smith D.。第24页/共29页252.4 字段限定检索字段限定检索(Field Limiting)第二部分 计算机信息检索技术 不同的检索系统其字段限定检索的表示方法也不尽相同。El Village中的限定字段检索采用within命令(简化为wn)和字段代码限定在特定的字段内进行检索,限定字段检索的输入格式为:检索词 wn 字段代码。ISI Web of Knowledg
18、e中的字段限定检索格式为:字段代码检索词。USPTO中的字段限定检索输入格式为:字段代码检索词,如TTL/computer。第25页/共29页262.4 字段限定检索字段限定检索(Field Limiting)第二部分 计算机信息检索技术PQDD中的字段限定检索的规则是:字段名或字段代码后跟用括号括起来的检索词,例如:title(biology);,au(Smith,Robert)。IEL中的字段限定检索采用算符,其格式为:检索词字段代码,例如:(fiber opticnetwork)ti。第26页/共29页272.5 短语检索短语检索(Phrase Search)第二部分 计算机信息检索技术 将短语用双引号“”括起来,表示检索出与“”内形式完全相同的短语,以提高检索的精确度,因而也称之为“精确检索”(exact search)。1.6 自然语言检索(Natural Language Search)即直接采用自然语言中的字、词、句进行提问式检索,同一般口语一样。这种基于自然语言的检索方式又被称为“智能检索”,特别适合不太熟悉网络信息检索技术的人们使用。第27页/共29页28检索技术部分结检索技术部分结束束谢谢!谢谢!数据库第28页/共29页/2929感谢您的观看!第29页/共29页