《研究生-信息检索概论.ppt》由会员分享,可在线阅读,更多相关《研究生-信息检索概论.ppt(77页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、医学文献检索与利用范晓磊 教学进度:课程安排教学大纲:课程性质和特点、要求与目标、教学法等信息检索基础学习目标1.掌握信息、情报、文献、知识的基本概念2.了解文献的类型、特点3.知道数据库的类型与结构4.掌握信息检索的途径、步骤5.理解检索式的编写与检索策略的调整6.熟悉信息网络技术与网络信息检索1.信息概论人类在经历了农业社会、工业社会后,已经步入信息化社会。物质、能源与信息已经成为社会发展的三大资源,人类开始从主要依赖物质和能源的社会步入物质、能源和信息三位一体的社会。信息的概念信息的特性信息的作用1.1 信息的概念信息information定义1:信息是物质运动规律总和,即不是物质,也不
2、是能量。定义2:信息论的创始人申农(Shannon)认为:“信息是能用来消除不确定性的东西”或“信息是确定性的增加”。定义3:信息是客观事物状态和运动特征的一种普遍形式。信息的定义和分类都不确定,不同的定义从不同的角度帮助理解信息。1.2 信息的特性信息区别于物质与能量,并具有与物质及能量同等的重要作用,是因为其特性。物质与能量在使用过程中会被消耗,但又遵守守恒定律;而信息在传递和使用过程是,可反复使用,并可通过信息的加工处理而产生信息增值。普遍性:信息是事物运动的状态和状态变化的方式。只要有事物的地方,就必然的存在信息。信息在自然界和人类社会活动中广泛、普遍存在。传递性:信息在事物之间的相互
3、联系必定在信息流动中发生。信息的传递性表现在人与人之间的信息交换,人与机器、机器与机器之间的信息交换,动物与植物间的信号交换。信息的传递和流通过程是一个重复使用的流通过程,信息的占有者不会因传递信息而失掉信息,也不会因多次使用改变信息的自身价值。这一点与信息的共享性相关。同时,信息的传递,在广义上来讲,包含反馈。(例)依存性:信息总是依附于一定的物质载体而存在,需要某种物质承担者。信息必须依附于一定的物质形式上(如声波、电磁波、纸张、化学材料、磁性材料等),不可能脱离物质而单独存在。相对性:客观上信息是无限的,但对于信息用户来说,人们实际获得的信息问题有限的。同一信息对不同认知水平的用户所产生
4、的作用和有效性也不同。可加工性:信息可以加工处理,可以压缩、扩充和叠加,也可以变换形态。在流通和使用过程中,经过综合、分析、再加工,大量的原始医药信息可以变成医学文摘数据库和 时效性:由于信息的动态性,那么一个固定的信息的使用价值必然会随着时间的流逝而衰减。在现代社会中,信息的使用周期迅速缩短,信息的价值实现也很大程度上取决于及时把握和运用信息(天气预报、经济信息、股票大盘等)。不能及时地使用最新信息,信息的价值就会随其滞后使用的时差而差值或贬值。可共享性:信息与物质,能量显著不同的是。信息在传递过程中并不是“此消彼长”,同一信息可以在同一时间被多个主体共有,而且还能够无限的复制、传递,它可以
5、共享。1.3 信息的作用信息在人类社会和科技发展中具有重要作用。信息是人类认识客观世界及其发展规律的基础。信息的基本功能,主要表现为信息的认识功能。信息是科学研究的必要备件。信息是管理和决策的主要参考依据。信息是社会发展的资源。2.知识、情报和文献知识:来源于信息,存储于人类的大脑中。现代汉语词典:知识是人们在改造世界实践中所获得的认识与经验的总结。知识包括:技术知识、科学知识、经验知识,关于知识的知识,及对面临的问题做出判断并提出解决方案的知识。OECD的四类知识:what,why,how,who显性知识(科学理论、数据公式、自然规律等)与隐性知识(外科医生的经验、领导的决策能力、“我爸是李
6、刚”)情报:是指传递着的在特定效用的知识。辞源:“定敌情如何,而报于上官者”为情报。辞海:“战时关于敌情之报告,曰情报。知识性:根据知识的定义和特性,知识去除了糟粕的信息,并且具有可实践性。传递性:没有被激活的知识只能发挥知识的价值,而不能体现情报的价值。效用性:情报最大的特点是可以发挥比其作为知识更为巨大的作用。文献:记录有知识的一切载体。文献本身并不是知识,其包含的内容才是知识。文献要素:知识内容、信息符号、载体材料。信息符号、载体材料和记录方式都影响知识内容的获取和利用。概念间的关系:知识来源于信息,情报是特定的知识。情报知识 信息信息、知识、情报、文献四者的关系认识激活信息知识情报检索
7、 记录文献3.信息源个人为满足其信息需要而获得信息的来源3.1 信息类型保存性:正式与非正式时间:先导(天气预报)、实时(现场直播)、滞后(报纸)表现形式:文字、图像、数值、语音出版类型:图书、期刊论文、科技报告、专利文献、会议文献政府出版物、学位论文、标准文献、产品样本、科技档案产生次序和加工程度(重要):零次、一次、二次、三次信息理解各层次信息的含义,根据各层次信息的特点能够判断不同出版类型的信息、文献分别属于什么层次的信息和文献。4.信息交流和信息素养4.1 信息交流噪音 去除噪音信源信道处理与控制信宿反馈4.2 信息需要指人们在从事各项实践活动的过程中,为解决所遇到的问题而产生的对信息
8、的需求。是信息行为发生的基础。信息需要的特征信息需要的层次(重要):未知的信息需要、潜在的信息需要和现实的信息需要。通过对信息需要层次的理解,能够判断自己或他人的信息需要的层次。4.3 信息行为:信息的检索、选择和利用。4.4 信息动机:是信息行为发生的根本动力。在信息交流中,信息需要和信息动机促使信息行为的发生,并完成信息的交流。5 信息素养5.1 信息素养(information literacy)概念是指判断何时、何地需要信息,并有效的定位、获取、评价和利用信息的一系列能力的总和。包括:计算机素养、因特网素养、媒体素养、图书馆素养、研究素养、批判性思考的能力。信息素养主要体现在:信息意识
9、:是人们对信息需求的自觉反映,即对信息的捕捉、分析、判断和吸收的敏感性。信息能力:是人们有效快速的获取加工存储利用和传递信息的能力。信息道德:是指在整个信息活动中,信息创建者、信息服务提供者和信息使用者所必须要遵守的社会法律法规和行为准则。5.2 美国大学与研究图书馆协会(ACRL)制定的高等教育信息素养五大标准1)能够独立决定所需要的信息种类和程度独立意味着在获取信息资源的过程中个人可以决定所需要的信息种类和程度,表现为主动学习、自主吸纳知识的过程。书、刊、学位论文、会议论文、专利、标准背景信息概念、事实、数据摘要信息题目、标题、文摘、参考文献全文信息观点、方法、结论、理论(电子、印刷的)2
10、)能够高效地获取所需信息高效意味着能选用最适当的查找方法或检索系统来建构完善的检索策略,获取所需信息。分类法、主题法、题名法、关键词法、作者法、机构法、组配法综合性、专业性、单一性 熟悉所在学科领域的主要信息源3)能够根据现有的知识背景和评价标准对信息及其来源进行评价及遴选在分析信息的基础上熟练地、批判性地评价信息,有效吸收、存储和快速提取信息,能从所收集的信息中概括出信息的中心思想,并能依据研究问题的要求来评价信息及其来源,提取出权威性的、经典的和具有创新理念的观点及其它发现,同时能在构建新的假设中查找补充所需信息,对新旧信息进行整合和综述。4)能有效地利用信息达到某一特定的目的有效地利用信
11、息意味着为达到某一特定的目的,在信息查找、获取、评价、补充的知识积累基础上,将文献中的主要观点、思想及相应事实数据等应用于自己有利于目的实现的表现形式,如学位论文、调查报告等,以此来与他人进行有效的交流。5)能够在信息利用过程中遵守相关的法律法规具备信息素养能力的人应了解与信息利用有关的道德、法律和社会经济问题,并能遵守法律、规章制度和有关获取与使用信息资源的行为规范。知识产权与版权、信息法、电子资源恶意下载与非法使用、正确引用、信息的无偿服务与有偿服务。6 信息检索6.1 信息检索概念是从任何信息集合中识别和获取所需信息的过程及其所采取的一系列方法和策略。广义的信息检索包含信息存储与检索6.
12、2 信息检索类型存储及内容:文献信息检索、数据信息检索、事实信息检索。组织方式:全文检索、超文本检索和超媒体检索。7 信息检索系统7.1 信息检索系统信息检索系统是信息检索的本质。信息检索系统根据文献特征信息(题名、著者、出版者、出版年、文献来源信息、文献原始编号、主题内容)按照一定的逻辑组织文献。检索系统对包含的信息进行描述,形成记录,通过这些描述提供检索途径,并使记录有序化。检索途径的两个因素:检索标识和可检序列检索标识:自然语言与情报语言自然语言:情报检索中指文献作者或文摘提要的作者原来使用的语言。不足之处:由于是日常口头、书写所用的各种语言。所以(1)不能简洁与专指地表达概念(2)语词
13、与概念不能一一对应(3)不能反映概念之间的关系(4)无法进行系统排列(5)标引用语与自然语言的相符性差。7.2 情报检索语言是一种人工语言,根据规则编制而成,规则预先明确规定。由词汇和语法组成。分类检索语言:中国图书馆学分类法,科图法主题检索语言:MeSH,EMTree代码检索语言情报检索语言的特点(对比自然语言)对文献内容加以标引,主题概念表达规范。对相同及相关内容加以集中或揭示其相关性。对大量情报加以系统化或组织化。便于将标识用语和检索用语进行相符性比较。7.2.1 医学主题词表常用美国医学主题词表MeSH荷兰医学文摘的主题情EMTree中国中医药学主题词表情报检索语言的特点(对比自然语言
14、)组成字顺轮排表(索引)是将主题词表中主题词和入口词按一定顺序(字顺等)排列而成。入口词:款目词,包括主题词的同义词、近义词、缩略语、不同拼写方式,倒装或顺装以及已经取消而意义相近的主题词。树状结构表(范畴表)将全部主题词按内容分为15个类目,各类主题词按各主题词内涵范围的大小逐级排列,形成树状结构。上下位概念:上位词的范围大,下位词的范围小,扩展检索是指某主题词所有下位主题词标引的全部文献都检出。副主题词(关联词):使用时有明确规定,必须遵循其定义与使用范围。副主题词也有上下位关系,使用时应选择恰当,以提高检全与检准率。7.2.2 检索结果评价检索效率,是概括表示情报检索系统质量的概念,可以
15、说明对情报检索系统各项性能的满意程度。包含检准率(查准率)与检全率(查全率),它们之间的关系是互逆相关的。检全率检准文献/(检准的献漏检文献)漏检率漏检文献/(检准的献漏检文献)检准率检准文献/(检准的献误检文献)误检率误检文献/(检准的献误检文献)其他:检索速度、检索方便性与检索成本也是需要考虑的因素。8 文献数据库与计算机检索技术手工检索基本上用于对纸质文献的检索。而随着技术的发展,文献被组织成各类型的数据库,计算机检索技术也随之成为主流。文献数据库:是指记录各种文献信息的数据库,计算机可读、有组织的相关文献信息的集合。在文献数据库中,文献信息以数字化方式,按一定的数据结构,有组织地存储在
16、计算机中,使计算机能够识别和处理。8.1 文献数据库类型根据收录性质可分为:文献型、全文型、事实型。文献数据库按内容分:书目数据库(Bibliographic Databases):存储文摘、题录、目录等书目数据的一类数据库,又称为二次文献数据库。全文数据库(Full Text Databases):以一次文献形式直接提供文献全文。混合数据库:即包含书目记录又包含有全文记录的文献数据库。其他类型参见教材P31几种主要的文献数据库P3236题录数据库文摘数据库图书馆馆藏目录数据库全文数据库光盘数据库多媒体数据库网络数据库(重要)文献数据库结构 文档(File)顺排文档:主文档,以文献记录作为信息
17、存储单元,按文献记录入藏的存取号从小到大顺序排列而形成的目录式文档,它存储有关于每篇文献的最完整信息。检索结果的信息来源于顺排文档。例:主题词索引、著者索引、刊名索引等倒排文档:就是把记录中一切可检字段或属性值抽出,按某种顺序重新加以组织后所得到的一种文档.倒排档从主文档中派生出来,所以,又叫做辅助文档。记录(Record)是构成数据库的完整的信息单元,每条记录都描述了一原始信息的外表和内容特征。例:书目数据库中的一条记录通常代表一篇文献。字段(Field)是记录的下级数据单位,用来描述实体的某一属性。例:题名、著者、文摘、主题词等篇名、著者和出处三个字段组成题录。8.2 自然语言在计算机检索
18、中的应用P3740不标引方式文本关键词匹配单汉字检索方式自动抽词标引方式:自动抽词标引自动赋词标引自动赋号标引自动聚类人机结合抽词标引关键词索引方式人工自由标引方式以自然语言作为自由词,与情报检索语言并用的方式自然语言接口方式用后控制词表弥补各种自然语言应用方式的不足自然语言检索应注意的问题 回顾:论坛BBS帖子和药品说明书分别属于几次文献?三次文献是在哪个层次的文献基础上产生的?计算机检索技术全部计算机检索(包括网络检索与数据库检索)的技术基础与技巧。1.计算机检索方法与检索途径2.检索策略与检索式3.检索步骤1.11.21.31.41.51.6布尔逻辑检索位置逻辑检索截词检索字段检索精确检
19、索加权检索1.1 布尔逻辑检索(Boolean Search)布尔逻辑运算:AND OR NOT(1)AND:逻辑“与”。常用符号:*检索结果中每条记录必须同时含有A和B检索词,增强检索的专指性,缩小检索范围。(2)OR:逻辑“或”。常用符号“+”。表示包含检索词A的文献或包含检索词B的文献或同时包含检索词A和检索词B的文献均为命中文献,逻辑“或”扩大了检索范围,提高查全率。某课题要求查找相关癌症的文献,而癌症有很多同个词来表达。全部词的并列是检索结果。Cancertumorcarcinomaneoplasm(3)NOT:逻辑“非”。常用符号“-”表示检索结果中每条记录必须包含检索词A,但不包
20、含检索词B。排除了不希望出现的检索词,缩小了检索范围,提高查准率。布尔逻辑关系表名称逻辑与逻辑或逻辑非符号ANDORNOT表达式A AND BA OR BA NOT B功能同时含有检索词A和B的文献,为命中文献凡是含有检索词A或B的文献,为命中文献凡是含有检索词A但不含有B的文献,为命中文献布尔运算符的优先级当一个检索表达式含有多个布尔算符时,执行的顺序:NOT ANDOR可用圆括号改变运算顺序,将需要优先运算者置于圆括号中。另:在检索时,各数据库对布尔逻辑关系词的拼写要求不同,有的要求大写,有的不区分大小写;同时,不同数据库中布尔逻辑关系词的符号也会不同。1.2 位置逻辑检索位置逻辑检索,又
21、称邻近检索、相邻度检索。它是基于文献中或文献记录中语词之间的相对次序或位置不同,它们所表达的意思可能不同;相应地,一个检索提问中语词之间的相对次序和位置不同,其表达的检索意图也不一样。因此,可以使用一些特定位置逻辑算符来限定检索词之间的位置关系,使检索提问式尽可能表达检索者真正的检索意图,从而既提高检准率,又提高见检全率。常用的位置算符有near、with等。near算符A near(n)B,检索词位置相邻,但无顺序关系,可前可后。with算符A with(n)B,检索词位置相邻,但有顺序关系,A必须出现在B前面,不可颠倒。1.3 截词检索截词检索是指在检索词中保留相同的部分,用截词符号代替可
22、变化的部分。它是为了部分解决由于检索式中对同义词列举不全造成的漏检现象而提出的,相当于用逻辑“或”扩展检索范围。截词符号一般用“?”或“*”等。截词检索主要用于年代、作者、同根词和单复数词的检索,减少输入负担,节省检索时间和费用,提高检全率。按截断的字符数量的不同分为:无限截词、有限截词。有限截词是用来对检索量进行限制的一种方法。其原理是在词干前后加以字符限制,使得检索出的词除词干外,前后缀所含字符必须与限定字符个数一致,或者在限定数以内。例如,银盘公司的MEDLINE光盘检索,computer?可以查到有关computer、computers、comptery词,但不会检出computeri
23、zed、computerizing、computerlab、computerphobia等词。无限截词按截断位置的不同分为:右截词、左截词、中间截词(前截词,后截词,中间截词)。例:computer*可以查到有关computer、computers、comptery、computerized、computerizing、computerlab、computerphobia等词。有的数据库采用截词符号,有的不用截词符号。有的数据库中,会自动检测词根,并默认进行截词检索,如新版Springerlink。1.4 字段检索是指将检索词的匹配限定在某个或某些特定的字段范围内进行。不同检索系统的字段限定方
24、法可能不同:“in”对某一或某些指定字段进行检索如:asthma in TI“=”用于限定性字段的检索如:LA=ENGLISH其他:“”py 2000 表示检索2000年前发表的文献记录。1.5 精确检索与模糊检索精确检索又称短语检索,是将一个短语(词组)当做一个独立的运算单元,往往用双引号括起来,进行严格匹配,以提高查准率。有的时候也用“”到限定,不要与字段限定混淆。“liver cancer”所检词组与输入必须完全一致。在通常没有限定的情况下,默认进行模糊检索,即输入Acute Pancreatitis,可检出Acutenecrotizing Pancreatitis、Acute gall
25、stonePancreatitis等。1.6 加权检索与扩展检索加权检索是为了弥补布尔逻辑检索不能揭示检索概念与检索课题相关程度的缺陷而提出来的。其基本思路是,由检索者自行对各检索词设置一个权值,并提出一个阈值,当检索出的提问式的总权值大于或等于阈值时,该文献为命中,否则为不命中。加权检索使量的概念进入了布尔检索,总权值的大小代表了文献与检索课题的相关程度。最后输出检索结果时,可以根据权值的大小顺序排列,这对用户是非常有用的。现在加权检索主要应用于以下情况:在某些数据库中表现为仅检索主要概念主题词,如MEDLINE,CBM等。而有些数据库表现为词频检索,如中国学术期刊全文数据库中可对检索词进行
26、词频的限定。这些都是加权检索 扩展检索是同时对多个相关检索词执行逻辑或检索的技术。即当用户输入一个检索词后,系统不仅能检出该检索词的文献,还能检出与该检索词同属于一个概念的同义词或下位词的文献,如PubMed和CBM中主题词的扩展检索。检索途径检索途径为检索系统的检索入口,即检索系统所提供的、用以查询获取资源的各种标识,在计算机检索系统中通常表现为字段检索。在各种检索途径中,具体应用前面我们提到的各种检索方法。常见的检索途径有:主题词检索自由词检索分类检索著者检索题名检索序号检索机构检索引文检索缺省检索其他检索检索方式在计算机检索中,最常见的检索方式通过下列四类来体现:浏览检索:主题浏览、学科
27、浏览、字顺浏览简单检索:快速检索、基本检索高级检索专家检索:专业检索关系:检索方法、检索途径与检索方式之间的划分有不同有交叉,但这些都是为了实行计算机检索做准备。2010-12-182.检索策略与检索式2.1 检索式2.2 检索策略652.1 检索式构成检索提问式的5种符号位置算符:表示所连接的各个单元词词间位置关系的符号。字段后缀符:限制检索词在数据记录中出现的字段位置,主要是题名、文摘、叙词和标识词字段,分别缩写为TI、AB、DE和ID。通常是在检出的文献量较多的情况下才考虑使用。限制符:挑选命中文献的文种、文献类型、出版时间和重要文章,约束检索结果。其形式和用法同上。字段前缀符:其作用与
28、限制符一样,都是表示文献的外部标志,不反映文献的内容,对检索式的命中文献从非主题方面加以限制。截词符:其作用是在保证关键词检索的前提下,扩大检索范围。另:()括号可以规定运算的优先次序。一般说来,使用布尔算符、括号、截词符和位置算符,就可以构造出一个比较完善、切题的检索式了。概括地说,检索式是检索策略的逻辑表达式,是指计算机信息检索中用来表达用户检索提问的逻辑表达式,由检索词和各种布尔逻辑算符、位置算符以及系统规定的其他组配连接符号组成。要求:能够运用各种检索方法,选择合适的检索途径,进行检索,并最终构成检索式。合适的检索式能够恰当地反映信息需求,并且由检索系统运行后,得到检准率与检全率都比较
29、高的检索结果。检索式的构成也是考核应用检索理论与掌握检索技巧的重要指标。2.2 检索策略广义的检索策略是指用户根据检索需求选择相应的数据库、确定检索方式、检索途径及相应检索表达式进行检索的一系列操作或方案,是用户检索目标的体现。狭义的检索策略仅指用户确定检索表达式进行检索的系列操作。广义的检索策略检索策略是对检索行为的全面策划,在操作上主要是指选择合适的数据库和编制检索提问式。前者取决于现有的数据源,后者则反映检索目标。尽管计算机检索为用户创造了良好的检索环境,尤其是其强大的检索功能、诸多的检索入口和用户友好的检索界面,即使对计算机检索知识掌握有限的人也能上机进行检索。但是,要想以低廉的成本(
30、时间成本、价钱成本等)快速地获得满意的检索效果,就离不开计算机检索的三个基本步骤,即全面地分析信息需要、选择合适的数据库、制定正确的检索策略。3 检索步骤不同的教材或者作者对于检索步骤的描述有所区别,其不一致之处是调整检索策略是否包含检索系统的重新选择。有的教材认为,检索系统在分析课题阶段即要合适,检索策略的调整仅限于在检索系统内进行调整。有的教材认为,检索策略的调整包含数据库的重新选择,数据源不同也会影响检索结果。经过分析,实际上这种检索步骤观点的不同是基于对检索策略的概念的不同理解之上。前一种观点采用的是狭义的检索策略,而后一种则基于广义的检索策略。而我们认为,在检索过程中,检索策略的调整
31、在某检索系统中和在检索源的选择中都存在。检索流程图11:医学文献检索(八年制教材)人民卫生出版社检索步骤说明:(1)分析研究课题这是指在着手查找信息的对课题进行分析,明确学科或专业的范围,弄情检索的真正意图及实质。它包括了解课题的内涵概念范围和外延概念范围,以便确定检索标识(检索词、分类等);明确课题所需信息的内容、性质和水平以及出版国别、语种和年限;了解并掌握课题的国内外情况;同时还要在分析的基础上形成主题概念,包括所需信息的主题概念有几个、概念的专指度是否合适、哪些是主要的、哪些是次要的等。还有些检索系统要求使用相应的词表和类表对选择出来的检索词进行核对,力求检索的主题概念准确反映检索需求
32、。可从以下几方面确定检索范围:专业范围:确定该课题涉及哪些专业及其相关的学科。时间范围:确定该课题需要检索信息的年代范围。地理范围:各国出版的检索系统以收藏本国的信息为主,因此要了解某课题在哪个国家处于领先地位、原则上就采用该国的检索系统。语种范围:视该课题在哪国占优势,据此选择该国母语的检索系统。信息类型:各种检索系统收录信息的着重点是不同的,即使是综合性检索系统也未必面面俱到,因此要选择与课题有关的、针对性强、适合课题需要的检索系统。(2)选择检索系统利用哪些检索系统进行查找,这直接与检索结果有关。要根据课题要求,选择与所查课题相适应、质量较高、检索手段比较完善的检索系统须了解和掌握其适用
33、范围、收录特点,然后可通过三次信息的选择和检索,如工具书指南、数据库目录、搜索引擎介绍等工具指引到二次信息检索系统。在选择检索系统时,要考虑的主要问题如下:在内容和时间方面,要考虑检索系统、数据库内容对课题内容的覆盖面和一致性,如应综合考虑检索系统、数据库收录信息的齐全、编制的质量、使用的方便等因素。在手段上和技术上,有机检条件的一般就不选择手检工具,机检无疑具有较高的检索效率。但是数据库收录的信息一般都是20世纪八九十年代,若需较久远的信息,若未被回溯建库,选择手工。所以在选择时必须掌握其收录信息的年代范围,才能获得满意的结果。考虑价格和可获得性,应选择就近容易获得的检索系统。(3)确定检索
34、途径两大类检索途径(把检索途径大致分类)一是反映信息内容特征的(主题、分类)途径二是反映信息外部特征的(著者、题名、代码等)途径(4)制定、调整检索策略检索过程是一个动态的随机过程,在某些检索环节中,会不可避免地产生一些和检索目标相差甚远的现象。检索词过于宽泛或过于偏窄而造成扩检或漏检,检索词不规范而引起的误检等。在评价检索效果的基础上,还要对检索结果进行信息反馈,便于重新修正检索策略,调整检索手段,进行新一轮的循环检索,从而实现检索目标的完善。782010-12-18(5)检索效果的评价指标检索效果是指信息系统检索信息的有效程度,反映了信息系统的检索能力。检索效果包括检索的技术效果和经济效果。技术效果是由信息系统完成其功能的能力确定,主要指性能和质量。经济效果由完成这些功能的价值确定,主要指信息系统服务的成本和时间。克兰弗登(cranfield)在分析用户基本要求的基础上,提出了六项评价系统性能的指标,分别为:收录范围、查全率、查准率、响应时间、用户负担和输出形式。其中,查全率和查准率是两个最主要也是最常用的指标。