《文献检索资料.pptx》由会员分享,可在线阅读,更多相关《文献检索资料.pptx(58页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、12023/3/17主要内容布尔逻辑检索1截词检索技术2位置算符检索3词组检索与字段检索4其它检索技术5第1页/共58页22023/3/17布尔逻辑检索运用布尔逻辑算符(Boolean operators)对检索词进行逻辑组配,表达两个概念之间的逻辑关系。布尔逻辑算符主要有AND(与)逻辑乘OR(或)逻辑加NOT(非)逻辑减 第2页/共58页32023/3/17布尔逻辑在中文数据库里,布尔逻辑运算符有时用AND、OR、NOT表示,有时用“*”、“”、“”有时也用“”表示AND“”表示NOT默认为OR第3页/共58页42023/3/17逻辑与(逻辑乘)表示概念的相交、限定,缩小检索范围,提高检准
2、率。用运算符号AND 或*连接检索词 A AND B A B第4页/共58页52023/3/17“逻辑与”举例计算机在图书馆的应用计算机图书馆计算机 AND 图书馆第5页/共58页62023/3/17“逻辑与”举例人类活动对群落多样性的影响检索概念人类活动、群落多样性、影响检索式人类活动 AND 群落多样性人类活动 AND 群落多样性 AND 影响第6页/共58页72023/3/17人类活动 AND 群落多样性第7页/共58页82023/3/17人类活动 AND 群落多样性 AND 影响第8页/共58页92023/3/17逻辑或表示概念的平行、并列,用于扩大检索范围,提高查全率用运算符“OR”
3、或“+”连接两检索词 A OR B A B第9页/共58页102023/3/17“逻辑或”举例乙肝病毒的研究 检索词乙肝、乙型肝炎、HBV、Hepatitis B virus 检索式乙肝 OR 乙型肝炎 OR HBVHepatitis B virus OR HBV第10页/共58页112023/3/17Hepatitis B virus第11页/共58页122023/3/17193条命中结果第12页/共58页132023/3/17Hepatitis B virus OR HBV第13页/共58页142023/3/17311条命中结果第14页/共58页152023/3/17逻辑非去掉一个主题中某
4、一部分的主题,用于缩小检索范围,提高查准率;用运算符号“NOT”或“-”连接两检索词 A NOT B A B第15页/共58页162023/3/17“逻辑非”举例例1:查“玉米但不是甜玉米”方面的文献。检索式=玉米-甜玉米例2:查“国外有关数字图书馆方面”的文献检索式=数字图书馆-国内第16页/共58页172023/3/17复合(嵌套)布尔检索运算顺序:NOTANDOR可通过()来改变运算的优先顺序 例:乙肝病毒受体的筛选检索词 HBV、Hepatitis B virus、receptor、screen检索式 (HBV OR Hepatitis B virus)AND receptor AND
5、 screen第17页/共58页182023/3/17 第18页/共58页192023/3/1710条命中结果第19页/共58页202023/3/17截词检索在实际检索中,常遇到词干相同、词义相近的检索词,或同一词的单、复数形式,动、名词形式,英美拼法等。用截词符号“?”、“*”或“$”加在检索词的前后或中间,以检索一组概念相关或同一词根的词。第20页/共58页212023/3/17截词检索这种检索方式可以扩大检索范围,提高查全率。截词运算符号通常有两个“?、*”在不同系统中表示的含义不同。第21页/共58页222023/3/17按截断的位置分后截断、前截断、中间截断按截词的字符数量分 有限截
6、词 无限截词第22页/共58页232023/3/17后截断在检索词后(右方)截断有限或无限的字母。如:librar*library、librarian、libraries主要用于词的单复数检索、词根检索(socio*)、年代检索(199*)第23页/共58页242023/3/17前截断将截词符号放在检索字符串的左方,表示其左边不管截去多少个字符,只要与截词符后面部分字符相同的检索词即可。也称为后方一致。如:*chemistrymicrochemistry、macrochemistry第24页/共58页252023/3/17中间截断又称“通用字符法”或“内嵌字符截断”,在检索词中间加一个或几个?
7、号。主要解决一些英美拼写不同,单复数形式的不同的词的输入。输入wom?n可检出woman,women输入defen?e可检出 defence、defense第25页/共58页262023/3/17有限截词即在检索词后截去有限的字母,如名词的单复数,动词的词尾变化等。输入computer?表示有0-2个字母变化,可检出computer和computers.输入stud?表示截断处有0-3个字母变化,可检出study,studies,studied。第26页/共58页272023/3/17无限截词在检索词后加一个“*“,表示该词后可加任意个字符。使用无限截词,所截词根不能太短,否则会输出许多无关文
8、献,易误检。例如:educat*可检出educator,educators,educated,educating,education第27页/共58页282023/3/17位置算符检索布尔逻辑运算符有时难以表达某些检索课题的确切提问要求,用词间位置算符来限定和组配检索词,可弥补布尔逻辑算符只是定性规定检索词的范围。第28页/共58页292023/3/17位置算符检索就是利用一些特定的位置算符来表达检索词之间的位置关系,并且可以不用叙词表而直接使用自由词进行检索的方法。位置算符检索第29页/共58页302023/3/17位置算符通常只出现在英文数据库中,多用于全文检索。常用的位置算符有W、nWN
9、、nNF、SAME位置算符第30页/共58页312023/3/17W功能:两词相邻,词序不变,中间不可插词,但两词间可有一个标点,连字符或空格。表达式Education(W)school 或 Education WITH school 检索结果education school;educationschool第31页/共58页322023/3/17nW功能:两词相邻,词序不变,两词之间允许插入0n个词。表达式:electronic(1W)resources检索结果Electronic resourcesElectronic information resources第32页/共58页332023
10、/3/17N功能:词序不限,中间不可插词,但两词间可有一个标点,连字符或空格。表达式:Education(N)school检索结果Education schoolEducationschoolSchool of Education第33页/共58页342023/3/17nN功能:词序不限,中间可插0n个词,两词间可有一个标点,连字符或空格。表达式:Education(1N)school检索结果Education schoolschool of educationEducation and schoolschool of music and education第34页/共58页352023/3/
11、17F功能:两词必须出现在同一字段中,词序与词量不限表达式:Education(F)school/AB检索结果:Education 和 school必须同时出现在文摘字段内即可字段名,表示文摘第35页/共58页362023/3/17SAME功能:两词出现在同一自然句中,其词序与词量不受限制表达式:Education SAME school检索结果:Education 和school两词出现在同 一句子中即可。第36页/共58页372023/3/17词组检索将一个词组或短语用双引号“”括起作为一个独立运算单元,进行严格匹配,以提高检索准确度。如:“Global Positioning Syste
12、m”,只检索出规定字段中包含完整词组的记录。第37页/共58页382023/3/17不加“”检索第38页/共58页392023/3/17命中结果504条第39页/共58页402023/3/17词组检索“”第40页/共58页412023/3/17命中结果431条第41页/共58页422023/3/17字段检索组成数据库的最小单位是记录,一条完整记录的每个著录事项为字段。在许多检索检索系统中,为了提高查全率或者查准率,需要将检索过程限制在特定的字段中,即字段检索。第42页/共58页432023/3/17数据库中常用检索字段列表西文数据库常用字段西文数据库常用字段中文数据库常用字段中文数据库常用字段
13、字段名称字段名称字段代码字段代码AbstractsAB摘要摘要AuthorAU作者作者Corporate Source、Organization、CompanyCS机构名称机构名称Descriptor、SubjectDE叙词叙词/主题词主题词Document TypeDT文献类型文献类型Full-textFT全文全文ISSNISSN国际标准连续出版物号国际标准连续出版物号Journal Name、Publication TitleJN期刊名称期刊名称Keyword、TopicKW关键词关键词LanguageLA语言语言Publication YearPY出版年出版年TitleTI标题标题第43
14、页/共58页442023/3/17使用字段检索对检索出文献数量和相关程度有极大影响。例如:DVD、DVD/ab、DVD/kw、DVD/ti、这些检索式从左到右检索范围缩小,检索出文献的数量也随之减少,但检索出文献与课题(DVD)的相关性提高。字段检索第44页/共58页452023/3/17其它检索技术区分大小写检索Web:专指万维网web:表示普通的网(蜘蛛网)第45页/共58页462023/3/17加权检索加权检索用加号表示某检索词一定要在检索结果中出现如:“十亚洲十金融风暴”含义是:找出关于在亚洲发生的金融风暴的信息,而不要亚洲之外的(即结果中必须同时有“亚洲”和“金融风暴”这两个词)第4
15、6页/共58页472023/3/17加权检索减号则用于表示英检索词一定不能出现在检索结果中。如:“十亚洲十金融风暴一南美洲”检索结果中绝对不要含有关于南美洲的信息(即检索结果中一定不能有“南美洲”这个词)。第47页/共58页482023/3/17加权检索由于加权检索技术在网络信息检索中应用的时间较短,因此,检索提问往往不能获得预期的效果。如果在一个检索提问中使用了表示加权捡索的加号或减号,其余未加符号的检索词在检索过程中的作用将被大大减弱。第48页/共58页492023/3/17自然语言检索 自然语言捡索指用户在检索时可输入自然语言表达的检索要求。例如“P1ease find for me s
16、omething about automobile sale in New York state”检索工具会按照提问检索出关于在纽约州(New York state)汽车销售(automobile sale)的信息。第49页/共58页502023/3/17自然语言检索这种检索的基本处理过程是:检索工具在接收到用户提问后,首先利用一个禁用词表从提问中剔除那些没有实质主题意义的词汇。例如各种副词、介词、代词、常用请求词(please、help、would、may等)、检索提问词(find、search、locate、check、information、materials等)然后将余下的词汇作为关键
17、词进行检索。第50页/共58页512023/3/17自然语言检索自然语言检索的效果取决于检索工具选择关键词的效率,而这方面我们仍面临许多局限。且用户输入词汇中往往有一些属于“禁用词”但确实表达了实质主题意义,如:“help me find some materials on search engines”中的search”、locate departments of materials sciences”的“materials”由于现在几乎所有检索工具都支持简单关键词检索,所以直接输入某句话中的关键词要比输入这句话本身要好得多(至少输入几个词吧)。第51页/共58页522023/3/17相关信
18、息反馈检索在检索过程中人们会发现某个结果非常符合自己需要,因此希望能进一步检索到与该结果类似的结果,我们称之为相关信息反馈捡索。我们可以人工进行这种检索,从已检索的信息中选取与提问相关的词语,作为下一轮检索的检索词。第52页/共58页532023/3/17相关信息反馈检索利用相关信息反馈检索,人们获得的检索结果似滚雪球一般,愈来愈多。Search for more documents like this oneMore like this第53页/共58页542023/3/17模糊检索模糊检索允许被检索信息和检索提问之间存在一定的差异,这种差异就是“模糊”在检索中的含义。例如,用户想查询有关“
19、中药使用”的信息,但不肯定这一提问在数据库中究竟以什么词表示,究竟是“中药的使用”、“使用中药”还是其它?第54页/共58页552023/3/17模糊检索模糊检索中所指的差异往往来自于用户在输入检索提问时的输入错误,如少键入一个字,打错一个字母等等。另一类差异来自某些词汇在不同国家的不同形式,例如“catalog”和“catalogue”。我们希望检索工具在这时能估计到这些词汇的正确形式或其它变形,使我们能够捡索到用正确词汇或其它变形形式标引的结果,而不是简单地告诉“输入错误”或“没有结果”。第55页/共58页562023/3/17概念检索所谓概念检索,是指当用户输入一个检索词后,检索工具不仅能检索出包含这个具体词汇的结果,还能检索出包含那些与该词汇同一类概念的词汇的结果。例加,检索“automobi1e”时能找出包含“automobile”、“car”、truck、van”、“bus“等任一词汇的结果。又如,在查找“公共交通”这一概念时,有关“公共汽车”或“地铁”的信息也能随之检得。在此意义上、概念检索考虑到了同义词、广义词和狭义词的使用。第56页/共58页2023/3/1757谢谢大家!第57页/共58页582023/3/17感谢您的观看!第58页/共58页