《信息检索原理及技术.ppt》由会员分享,可在线阅读,更多相关《信息检索原理及技术.ppt(95页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、 检索检索原理及检索技术原理及检索技术目目 录录第第1节节信息检索原理信息检索原理第第2节节数据库知识介绍数据库知识介绍第第3节节信息检索技术信息检索技术第第1节节 信息检索原理信息检索原理一、信息检索类型一、信息检索类型(复习)(复习)二、信息检索效率二、信息检索效率三、信息检索步骤三、信息检索步骤一、信息检索类型信息检索类型1、文献、文献信息检索信息检索2、数据信息检索、数据信息检索3、事实信息检索、事实信息检索1、文献信息检索书目检索书目检索全文检索全文检索书目信息检索书目信息检索以标题、作者、原文来源、摘要及以标题、作者、原文来源、摘要及收藏地点为检索对象的一类检索称收藏地点为检索对象
2、的一类检索称为为“书目信息检索书目信息检索”。特点:检索结果不直接解答用户提特点:检索结果不直接解答用户提出的技术问题,只提供有关线索。出的技术问题,只提供有关线索。例如:查例如:查“我国城市居民奶制品消费习我国城市居民奶制品消费习惯惯”的有关文献信息。的有关文献信息。张明立张明立.我国城市居民奶制品消费行为的我国城市居民奶制品消费行为的调查分析调查分析.中国乳品工业中国乳品工业.20022002(3 3)四川大学图书馆收藏有原文。四川大学图书馆收藏有原文。全文信息检索全文信息检索以论文或专利说明书的全文为检索对象的一类以论文或专利说明书的全文为检索对象的一类检索叫做全文信息检索。检索叫做全文
3、信息检索。特点:检索结果是与课题相关的论文或专利说特点:检索结果是与课题相关的论文或专利说明书的全文。明书的全文。是在书目信息检索基础上是在书目信息检索基础上更深层次更深层次的内容检索。的内容检索。(如如维普维普从书目到全文一步到位)从书目到全文一步到位)2、数据信息检索数据信息检索以具有以具有数量性质数量性质并以并以数值形式数值形式表示的表示的数据数据为检为检索对象的一类检索。索对象的一类检索。检索结果是经过测试和评价过的各种数据。检索结果是经过测试和评价过的各种数据。如如:各种物质的物理化学常数,各种统计数据各种物质的物理化学常数,各种统计数据和工程数据。和工程数据。它是一种确定性检索。一
4、般常用数据大全、手它是一种确定性检索。一般常用数据大全、手册、年鉴进行检索。册、年鉴进行检索。3、事实信息检索事实信息检索以事项为检索对象,检索结果是有关某一以事项为检索对象,检索结果是有关某一事物的具体答案。事物的具体答案。如如:日本哪些公司在生产等离子电视机。日本哪些公司在生产等离子电视机。它也是一种确定性检索。一般常用手册、它也是一种确定性检索。一般常用手册、年鉴、百科全书进行检索。年鉴、百科全书进行检索。第第1节节 信息检索原理信息检索原理一、信息检索类型一、信息检索类型(复习)(复习)二、信息检索效率二、信息检索效率三、信息检索步骤三、信息检索步骤二、二、信息检索效率信息检索效率信息
5、检索效率是评价一个检索系统性能优劣的信息检索效率是评价一个检索系统性能优劣的质量标准,它贯穿于信息的存储和检索的全过质量标准,它贯穿于信息的存储和检索的全过程。包括检索系统的可利用性,信息资源的可程。包括检索系统的可利用性,信息资源的可利用性和可获得性,检索系统之检索技术的可利用性和可获得性,检索系统之检索技术的可利用性和友好性。其评价的具体指标是利用性和友好性。其评价的具体指标是查全率查全率 查准率查准率查全率查全率利用检索系统进行某一课题检索时,检出的相关利用检索系统进行某一课题检索时,检出的相关信息量(信息量(w)与该系统中存储的相关信息量()与该系统中存储的相关信息量(X)的比率称为查
6、全率(的比率称为查全率(R),用公式表示如下:),用公式表示如下:R=(检出文献检出文献W/系统中存储的文献系统中存储的文献X)100%查查 准准 率率利用检索系统进行某一课题检索时,检利用检索系统进行某一课题检索时,检出的相关信息量(出的相关信息量(w)与检出信息总量()与检出信息总量(M)的比率称为查准率(的比率称为查准率(P),用公式表示如下:),用公式表示如下:P=(检出的检出的相关信息量相关信息量W/检出的检出的所有信息量所有信息量M)100%第第1节节 信息检索原理信息检索原理一、信息检索类型一、信息检索类型(复习)(复习)二、信息检索效率二、信息检索效率三、信息检索步骤三、信息检
7、索步骤三、三、检索步骤检索步骤1 1、明确检索目的。、明确检索目的。2、对检索课题进行分析,找出检索词。、对检索课题进行分析,找出检索词。3、制定检索策略(包括选检索系统、选检、制定检索策略(包括选检索系统、选检索途径、编制检索提问式)。索途径、编制检索提问式)。4、区分文献类型。、区分文献类型。5、整理信息线索,索取原始文献。、整理信息线索,索取原始文献。1、明确检索目的、明确检索目的明确所需信息的用途。明确所需信息的用途。如果仅仅是给科研课题找一些参考资料,就要如果仅仅是给科研课题找一些参考资料,就要求查准,查出的文献一定要有参考价值。求查准,查出的文献一定要有参考价值。如果是开题,成果鉴
8、定,申请专利,则要求全,如果是开题,成果鉴定,申请专利,则要求全,则需充分考虑检索词的泛指性。而且要多编制则需充分考虑检索词的泛指性。而且要多编制几个检索式,用以调整检索结果。几个检索式,用以调整检索结果。举例:木薯生料发酵生产酒精工艺举例:木薯生料发酵生产酒精工艺检索目的和要求:检索目的和要求:目的:科技立项目的:科技立项要求:国内有无要求:国内有无1.薯类生产酒精的文献报道;薯类生产酒精的文献报道;2.木薯生料木薯生料发发酵生酵生产产酒精酒精的文献报道。的文献报道。返回三、三、检索步骤检索步骤1 1、明确检索目的。、明确检索目的。2 2、对检索课题进行分析,找出检索词。、对检索课题进行分析
9、,找出检索词。3、制定检索策略(包括选检索系统、选检、制定检索策略(包括选检索系统、选检索途径、编制检索提问式)。索途径、编制检索提问式)。4、区分文献类型。、区分文献类型。5、整理信息线索,索取原始文献。、整理信息线索,索取原始文献。2、分析课题,找出检索词、分析课题,找出检索词根据检索目的和要求,选择检索词。根据检索目的和要求,选择检索词。首先要从首先要从专业专业的角度来选取检索词。我的角度来选取检索词。我们的专业知识水平和检索经验直接影响检索们的专业知识水平和检索经验直接影响检索词的选择。而检索词选择得好与否又直接影词的选择。而检索词选择得好与否又直接影响检索效果。响检索效果。木薯生料发
10、酵生产酒精新工艺木薯生料发酵生产酒精新工艺主题分析主题分析:第一层面:薯;木薯;第一层面:薯;木薯;第二层面:酒精;乙醇;第二层面:酒精;乙醇;第三层面:发酵;第三层面:发酵;第四层面:生料;第四层面:生料;第五层面:工艺;第五层面:工艺;返回三、三、检索步骤检索步骤1 1、明确检索目的。、明确检索目的。2、对检索课题进行分析,找出检索词。、对检索课题进行分析,找出检索词。3 3、制定检索策略(包括选检索系统、选检、制定检索策略(包括选检索系统、选检索途径、编制检索提问式)。索途径、编制检索提问式)。4、区分文献类型。、区分文献类型。5、整理信息线索,索取原始文献。、整理信息线索,索取原始文献
11、。3、制定检索策略、制定检索策略1)选检索系统)选检索系统中文检索系统中文检索系统(文种)(文种)外文检索系统外文检索系统学术论文检索系统学术论文检索系统(文献类型)(文献类型)专利文献检索系统专利文献检索系统2)选检索途径)选检索途径常用分类途径、主题途径、作者途径等。常用分类途径、主题途径、作者途径等。3)编制检索提问式)编制检索提问式木薯生料发酵生产酒精新工艺木薯生料发酵生产酒精新工艺检索词:检索词:薯;木薯;酒精;乙醇;发酵;薯;木薯;酒精;乙醇;发酵;生料;免蒸煮;工艺;生料;免蒸煮;工艺;检索式:检索式:(薯(薯+木薯)木薯)*(酒精(酒精+乙醇)乙醇)*(生料(生料+免蒸免蒸煮)
12、煮)*发酵发酵实现检索策略分为下面两步。分为下面两步。获取文献信息线索:获取文献信息线索:实质上是实现书目信息检索。如查重庆维普中实质上是实现书目信息检索。如查重庆维普中国科技期刊数据库,中国期刊网数据库(国科技期刊数据库,中国期刊网数据库(CNKI),),万方数据库;万方数据库;EIVILLAGE,CA等。等。索取文献原始信息:索取文献原始信息:实质上是实现全文信息检索。获取原文前首先实质上是实现全文信息检索。获取原文前首先区分文献类型。区分文献类型。返回三、三、检索步骤检索步骤1 1、明确检索目的。、明确检索目的。2、对检索课题进行分析,找出检索词。、对检索课题进行分析,找出检索词。3、制
13、定检索策略(包括选检索系统、选检、制定检索策略(包括选检索系统、选检索途径、编制检索提问式)。索途径、编制检索提问式)。4 4、区分文献类型。、区分文献类型。5、整理信息线索,索取原始文献。、整理信息线索,索取原始文献。4、区分文献类型。、区分文献类型。1)图书(图书(著作著作)2)期刊论文期刊论文3)会议论文)会议论文4)专利说明书)专利说明书5)科技报告)科技报告1)图书特征:特征:作者作者书名书名出版社、出版地、版次出版社、出版地、版次国际标准书号。国际标准书号。总页码。总页码。2)期刊特征:特征:篇名篇名作者作者来源来源(刊名刊名,年卷期年卷期,起止页码起止页码)文摘文摘2)期刊(续)
14、期刊(续)题名:广西木薯燃料酒精产业发展研究题名:广西木薯燃料酒精产业发展研究作者:作者:秦建文秦建文 王耀钰王耀钰 叶洪强叶洪强作者工作单位:广西大学商学院作者工作单位:广西大学商学院,广西南宁广西南宁530002530002来源:木薯精细化工来源:木薯精细化工.2002.2002,(,(2 2):):12-1512-15摘要摘要:随着矿物质能源日益减少和枯竭,发展可随着矿物质能源日益减少和枯竭,发展可再生能源势在必行。木薯是生产可再生能源再生能源势在必行。木薯是生产可再生能源燃燃料酒精的主要原材料。与用甘蔗、玉米、小麦、马料酒精的主要原材料。与用甘蔗、玉米、小麦、马铃薯、红薯等农作物为原材
15、料生产燃料酒精相比,铃薯、红薯等农作物为原材料生产燃料酒精相比,利用木薯生产燃料酒精经济性最好。利用木薯生产燃料酒精经济性最好。3)会议论文)会议论文特征:特征:会议论文,给出会议或会议录名称、主办单位、会议论文,给出会议或会议录名称、主办单位、会议召开地点和时间等。可用下列单词区别:会议召开地点和时间等。可用下列单词区别:典型关键词:典型关键词:Proceedings、Conference、Meeting、Symposium、Convention。4)、专利说明书)、专利说明书特征:特征:专利说明书:给出专利国别、专利号、专利说明书:给出专利国别、专利号、IPC号和批准日期等。如号和批准日期
16、等。如B22D11CN1044964A例如:专利信息20081010846710130254020080602一种木薯生淀粉批量发酵酒精的生物方法一种木薯生淀粉批量发酵酒精的生物方法C12P7/06、C12G3/02王怀能、王辉、文科王怀能、王辉、文科王怀能、王辉、文科王怀能、王辉、文科一种木薯生淀粉批量发酵的生物方法,包括将新鲜木薯或干木薯,一种木薯生淀粉批量发酵的生物方法,包括将新鲜木薯或干木薯,用用水溶液浸泡,粉碎过筛,按照料水比水溶液浸泡,粉碎过筛,按照料水比 的比例调浆,调整酸度及营养成分,按照原料量的的比例调浆,调整酸度及营养成分,按照原料量的的比例加入生料发酵剂,控温的比例加入生
17、料发酵剂,控温,机械搅拌,机械搅拌转分的速率搅拌,发酵小时后,蒸馏得乙醇或木转分的速率搅拌,发酵小时后,蒸馏得乙醇或木薯饮料酒。薯饮料酒。5)、科技报告著录格式)、科技报告著录格式特征:特征:ReportADPBDOENASA为什么要区分原文为什么要区分原文?收藏地点不同。收藏地点不同。原文索取方法不同。原文索取方法不同。文后参考文献的标注。文后参考文献的标注。三、三、检索步骤检索步骤1 1、明确检索目的。、明确检索目的。2、对检索课题进行分析,找出检索词。、对检索课题进行分析,找出检索词。3、制定检索策略(包括选检索系统、选检、制定检索策略(包括选检索系统、选检索途径、编制检索提问式)。索途
18、径、编制检索提问式)。4、区分文献类型。、区分文献类型。5 5、整理信息线索,索取原始文献。、整理信息线索,索取原始文献。5)索取原文)索取原文(期刊)(期刊)将所得的检索结果进行归类整理后,按将所得的检索结果进行归类整理后,按由近由近及远及远的原则索取原文。的原则索取原文。(1)上网查找全文(网络全文数据库)上网查找全文(网络全文数据库)(2)查本馆馆藏目录,由索取号借阅或复制。)查本馆馆藏目录,由索取号借阅或复制。(3)查联合目录,由索取号向收藏单位借阅)查联合目录,由索取号向收藏单位借阅或复制。或复制。(4)其他方法获取全文。)其他方法获取全文。例如:查全文的数据库例如:四川大学馆藏目录
19、返回第第2 2节节 数据库知识介绍数据库知识介绍一、检索前知识准备一、检索前知识准备二、关于数据库二、关于数据库 一、检索前知识准备一、检索前知识准备1、什么是期刊、什么是期刊期刊期刊期刊亦称杂志,一般是指定期或不定期出期刊亦称杂志,一般是指定期或不定期出版的版的连续出版物连续出版物。它的特点是:有比较固定的刊名,一般出它的特点是:有比较固定的刊名,一般出版周期恒定且短(如:单月、双月、季刊版周期恒定且短(如:单月、双月、季刊等)。等)。期刊论文内容新颖、丰富、学术性强,是期刊论文内容新颖、丰富、学术性强,是人们交流学术思想的主要媒介,也是开展人们交流学术思想的主要媒介,也是开展科学研究主要的
20、信息源之一科学研究主要的信息源之一2、关于数据库数据库就是数据库就是“按照数据结构来组织、存按照数据结构来组织、存储和管理数据的仓库。储和管理数据的仓库。或者说:数据库是计算机存储设备上按或者说:数据库是计算机存储设备上按一定方式,合理组织并存储的一定方式,合理组织并存储的相互有关相互有关联的数据的集合。联的数据的集合。数据库类型(复习)1、参考数据库、参考数据库2、源数据库、源数据库1、参考数据库参考数据库1)书目数据库)书目数据库存储描述目录、题录、文摘等书目线存储描述目录、题录、文摘等书目线索的数据库。(文献型数据库)索的数据库。(文献型数据库)2)指南数据库)指南数据库存储描述关于机构
21、、人物、产品、活存储描述关于机构、人物、产品、活动等对象的数据库。(工具书数据库)动等对象的数据库。(工具书数据库)1、书目数据库存储描述如目录、题录、文摘等书目线索的数据库,又称二次文献信息数据库。目录型数据库:描述整本文献。如:目录 题录描述单篇文献:文摘描述单篇文献:返回返回2、源数据库存储全文、数值、结构式等信息,能直存储全文、数值、结构式等信息,能直接提供原始信息或具体数据,用户不必接提供原始信息或具体数据,用户不必再转查其它信息源的数据库。再转查其它信息源的数据库。1)全文数据库)全文数据库存储原始全文(或主要部份的)一种源存储原始全文(或主要部份的)一种源数据库。如维普数据库。数
22、据库。如维普数据库。2)数值数据库)数值数据库如各种统计数据库、科学技术数据库等。如各种统计数据库、科学技术数据库等。1)全文数据库存储原始信息全文。如期刊全文数据库、存储原始信息全文。如期刊全文数据库、专利全文数据库、百科全文数据库。专利全文数据库、百科全文数据库。全文数据库存放的全文数据库的结构数据库是由若干个互有联系的文档(数据库是由若干个互有联系的文档(filefile)组)组成的成的,文档是书目数据库数据组织的基本形式,文档是书目数据库数据组织的基本形式,文档里的数据被称为记录,一个记录又包含若文档里的数据被称为记录,一个记录又包含若干个字段。干个字段。数据库数据库文档文档字、词字、
23、词记录记录字段字段文 档数据库是由若干个互有联系的文档数据库是由若干个互有联系的文档(file)组成的,信息检索数据库的文档)组成的,信息检索数据库的文档包括包括主文档主文档、索引文档索引文档和和帮助系统文档帮助系统文档三部分。三部分。主文档主文档(顺排文档)排文档)记录按时间顺序存放,记录之间的逻辑顺记录按时间顺序存放,记录之间的逻辑顺序与物理顺序是一致的,是一种线形文档,序与物理顺序是一致的,是一种线形文档,文档的记录按文献信息获得的先后顺序排文档的记录按文献信息获得的先后顺序排列,故又名为列,故又名为顺排文档。顺排文档。但对于所存储数据的某一方面属性,但对于所存储数据的某一方面属性,如作
24、如作者、关键词等,则是无序的者、关键词等,则是无序的,即不能按关,即不能按关键词的字顺查询。键词的字顺查询。索引文档(索引文档(倒排文档)倒排文档)将顺排文档中各个记录中含有主题性质的字将顺排文档中各个记录中含有主题性质的字段(如主题词字段、标题字段、叙词字段等)段(如主题词字段、标题字段、叙词字段等)和非主题性质字段(如作者字段、机构字段、和非主题性质字段(如作者字段、机构字段、来源字段等)分别提取出来,按某种顺序重来源字段等)分别提取出来,按某种顺序重新组织得到的一种文档。新组织得到的一种文档。检索时,系统先在索引文档中检索,获得记录号,然后进入顺排文档查找。帮助系统文档凡是比较成熟的信息
25、检索系统,还配有凡是比较成熟的信息检索系统,还配有完善的在线检索帮助,包括系统使用的完善的在线检索帮助,包括系统使用的检索算符、组配规则、以及使用实例说检索算符、组配规则、以及使用实例说明性文档,以网页的形式提供给在线用明性文档,以网页的形式提供给在线用户。户。记录记录是数据库中数据集合的一个单位,是组记录是数据库中数据集合的一个单位,是组成文档的基本数据单位。成文档的基本数据单位。在书目数据库中,一个记录相当于一条题录在书目数据库中,一个记录相当于一条题录或文摘或文摘记录又由字段构成,字段则是组成记录的基记录又由字段构成,字段则是组成记录的基本数据单位。一个记录通常由标题字段、作本数据单位。
26、一个记录通常由标题字段、作者字段、来源字段、文摘字段、主题词字段、者字段、来源字段、文摘字段、主题词字段、分类号字段、语种字段等组成。分类号字段、语种字段等组成。CNKI中的一条记录中的一条记录题名字段题名字段作者字段作者字段文摘字段文摘字段关键词字段关键词字段来源字段来源字段EI 中的一条记录中的一条记录主主题题字字段段辅助字段12字段字段是组成记录的基本数据单位。字段是组成记录的基本数据单位。字段通常有标题字段、作者字段、来源字段、字段通常有标题字段、作者字段、来源字段、文摘字段、主题词字段、分类号字段、语种字文摘字段、主题词字段、分类号字段、语种字段等。段等。按照字段所代表记录的性质不同
27、,字段通常分按照字段所代表记录的性质不同,字段通常分为基本字段和辅助字段两类。为基本字段和辅助字段两类。基本字段有题名字段、文摘字段、主题词字段基本字段有题名字段、文摘字段、主题词字段等。辅助字段有作者、作者工作单位,文献来等。辅助字段有作者、作者工作单位,文献来源,出版事项等。源,出版事项等。基本字段基本字段辅助字段辅助字段字段名称字段名称字段代码字段代码字段名称字段名称字段代码字段代码标标题题T/TI记录号记录号AN文文摘摘R/AB作作者者A/AU叙叙词词DE机构机构S/OG标识词标识词ID来源来源SO关键词关键词K/KW出版年出版年PY控制词控制词CT国家国家CU非控制词非控制词UT语语
28、种种LA 字段类型与代码字段类型与代码数据库常用的字段第第3节节 信息检索技术信息检索技术一、检索技术一、检索技术 1 1 布尔检索布尔检索 2 2 词位词位检索检索 3 3 截词检索截词检索 4 4 限制检索限制检索二、检索技术应用二、检索技术应用三、如何选用关键词三、如何选用关键词1 布尔检索布尔检索布尔逻辑算符的形式及含义布尔逻辑算符的形式及含义(1)逻辑与逻辑与(2)逻辑或)逻辑或(3)逻辑非)逻辑非逻辑与逻辑与1、概念:逻辑与是一种具有概念交叉或概、概念:逻辑与是一种具有概念交叉或概念限定关系的组配。念限定关系的组配。2、算符:、算符:“*”或或“AND”,并且并且3、特点:增强了专
29、指度,提高了查准率。特点:增强了专指度,提高了查准率。4、举例:、举例:“微波微波”AND“通信通信”,表示,表示两个概念应同时包含在一条记录中。两个概念应同时包含在一条记录中。返回逻辑或逻辑或1、概念:逻辑或是一种具有概念相同,、概念:逻辑或是一种具有概念相同,概念相关的组配。概念相关的组配。2、算符:、算符:“+”、“OR”、“或者或者”3、特点:扩大检索范围,提高了查全率。特点:扩大检索范围,提高了查全率。4、举例:、举例:“废水废水”OR“污水污水”,表,表示这两个并列的同义概念分别在一条记示这两个并列的同义概念分别在一条记录中出现或同时在一条记录中出现。录中出现或同时在一条记录中出现
30、。返回逻辑非逻辑非1、逻辑非是一种具有概念排除关系的组配。、逻辑非是一种具有概念排除关系的组配。2、算符:、算符:“-”、“NOT”、不包含、不包含3、特点:排除不需要的概念,提高查准率,但影特点:排除不需要的概念,提高查准率,但影响查全率。响查全率。4、举例:、举例:“制药废水制药废水NOT放射废水放射废水”表示检索出的记录中排除含有表示检索出的记录中排除含有“放射废水放射废水”的记的记录。录。A布尔逻辑组配图布尔逻辑组配图(a)逻辑逻辑与与A=619B=23290AANDB=54(b)逻辑逻辑或或A=341B=76AORB=364(c)逻辑逻辑非非A=25283B=4945ANOTB=24
31、31工程索引EI返回中国知识产权局网站中国专利检索第第3节节 信息检索技术信息检索技术一、检索技术一、检索技术 1 1 布尔检索布尔检索 2 2 词位词位检索检索 3 3 截词检索截词检索 4 4 限制检索限制检索二、检索技术应用二、检索技术应用三、如何选用关键词三、如何选用关键词2、词位检索词位检索词位检索具有限定检索词的词与词之间词位检索具有限定检索词的词与词之间位置关系的功能,可位置关系的功能,可弥补布尔逻辑算符弥补布尔逻辑算符只是定性规定检索词的范围,不确定相只是定性规定检索词的范围,不确定相互位置和顺序的缺陷互位置和顺序的缺陷。以提高检准率。以提高检准率。多见于国外数据库。多见于国外
32、数据库。2、词位检索词位检索(续)(续)同句检索:同句检索:两个检索词需在同一句话中出现。两个检索词需在同一句话中出现。如四川(同句)大学如四川(同句)大学2、词位检索词位检索(续)(续)同段检索:两词需在同一字段出现。两词需在同一字段出现。如空气(同段)污染如空气(同段)污染第第3节节 信息检索技术信息检索技术一、检索技术一、检索技术 1 1 布尔检索布尔检索 2 2 词位词位检索检索 3 3 截词检索截词检索 4 4 限制检索限制检索二、检索技术应用二、检索技术应用三、如何选用关键词三、如何选用关键词3 截词检索截词检索截词检索是防止漏检,提高查全率的一截词检索是防止漏检,提高查全率的一种
33、常用检索技术。大多数网站都提供了截种常用检索技术。大多数网站都提供了截词检索的功能。有的网站也叫做通配符或词检索的功能。有的网站也叫做通配符或词干法。用或词干法。用或?表示。?表示。截词是在检索词的适当位置进行截断,截词是在检索词的适当位置进行截断,节省输入的字符,达到较高的查全率。节省输入的字符,达到较高的查全率。后后截词截词后截词(又称右截词):后截词(又称右截词):是一种满足是一种满足前方一致的检索。前方一致的检索。例如:例如:book*可检出可检出:book和和books两个词。两个词。treat*可检出:可检出:treat和和treatment两个词。两个词。4、限制限制检索索限制检
34、索是将检索词限制在特定的范围内检限制检索是将检索词限制在特定的范围内检索。索。常用的限制检索有常用的限制检索有:字段、文献类型、语种:字段、文献类型、语种 年代。年代。特点特点:限制查找的范围,满足课题对查全、限制查找的范围,满足课题对查全、查准的要求查准的要求第第3节节 信息检索技术信息检索技术一、检索技术一、检索技术 1 1 布尔检索布尔检索 2 2 词位词位检索检索 3 3 截词检索截词检索 4 4 限制检索限制检索二、检索技术应用二、检索技术应用三、如何选用关键词三、如何选用关键词检索技术在检索技术在CNKICNKI中的应用中的应用布尔检索:布尔检索:逻辑与:逻辑与:*and并且(高级
35、检索并且(高级检索选择)选择)逻辑或逻辑或:+or或者(高级检索或者(高级检索选择)选择)逻辑非:逻辑非:-not不包含(高级检索不包含(高级检索选择)选择)词位检索:词位检索:同句检索(指一句话)(高级检索同句检索(指一句话)(高级检索选择)选择)同段检索(指同一字段中)(高级检索同段检索(指同一字段中)(高级检索选择)选择)限制检索:字段限制,匹配度限制,时间限制限制检索:字段限制,匹配度限制,时间限制检索技术在CNKI中的应用同段检索同段检索同句检索同句检索第第3节节 信息检索技术信息检索技术一、检索技术一、检索技术 1 1 布尔检索布尔检索 2 2 词位词位检索检索 3 3 截词检索截
36、词检索 4 4 限制检索限制检索二、检索技术应用二、检索技术应用三、如何选用关键词三、如何选用关键词 关键词的选择关键词的选择选选定定的的关关键键词词应应符符合合课课题题主主题题;并并应应列列出出常常用用中中外外文文同同义义词词、缩缩写写词词,以以及及核核心关键词的上下位类词。心关键词的上下位类词。应应充充分分利利用用词词表表、辞辞海海、术术语语标标准准、词词典典等等工工具具书书,以以及及从从已已检检出出的的文文献献中中,扩扩展展检检索用索用词词。关键词的选择应注意关键词的选择应注意 立足规范词,兼顾自由词立足规范词,兼顾自由词 词的全称、简称及缩写字母词的全称、简称及缩写字母 必要时应向上下
37、位类词扩检必要时应向上下位类词扩检 注意外来词的译写变化注意外来词的译写变化 慎用词组或短语慎用词组或短语切记:同义词是文献检索中的永恒难题!切记:同义词是文献检索中的永恒难题!确定规范词,兼顾自由词确定规范词,兼顾自由词 课题名称:布鲁氏菌病防治研究课题名称:布鲁氏菌病防治研究 1274布鲁氏菌病布鲁氏菌病Brucellosis379布氏杆菌病布氏杆菌病Brucellosis99布鲁氏杆菌病布鲁氏杆菌病Brucellosis17传染性流产传染性流产 Epizooticabortion13波状热波状热Undulantfever9地中海热地中海热Mediterraneanfever8马尔他热马尔
38、他热Maltafever 确定规范词,兼顾自由词确定规范词,兼顾自由词 胶粘剂胶粘剂9370粘固剂粘固剂265粘合剂粘合剂5291胶结剂胶结剂141粘结剂粘结剂3850粘胶剂粘胶剂122粘接剂粘接剂1109粘着剂粘着剂102黏合剂黏合剂603胶合剂胶合剂88胶黏剂胶黏剂519粘附剂粘附剂75 注意词的全称、简称及缩写字母注意词的全称、简称及缩写字母中国专利库中国专利库 期刊库期刊库乙型病毒性肝炎乙型病毒性肝炎311939乙型肝炎乙型肝炎71632505乙肝乙肝78318416脱氧核糖核酸脱氧核糖核酸2131992DNA711187202126887202检索技术应用示例检索课题:农民工生存状况调查检索课题:农民工生存状况调查检索词:检索词:检索式:(农民工检索式:(农民工+农民农民+打工妹打工妹+打工仔)打工仔)*(生活(生活+生存生存+待遇)待遇)农民工农民工打工妹打工妹打工仔打工仔生生 存存生生 活活待待 遇遇提 问1、状况、调查为什么没有作为检索词?2、什么样的词不宜作检索词?思考题1、如何选择关键词?2、信息检索技术在不同数据库中运用的 情况?3、布尔检索算符的表达形式?4、布尔检索算符的含义?5、检索时为什么通常要限制检索字段?