信息检索基本原理与方法.ppt

上传人:wuy****n92 文档编号:78608747 上传时间:2023-03-18 格式:PPT 页数:68 大小:4.26MB
返回 下载 相关 举报
信息检索基本原理与方法.ppt_第1页
第1页 / 共68页
信息检索基本原理与方法.ppt_第2页
第2页 / 共68页
点击查看更多>>
资源描述

《信息检索基本原理与方法.ppt》由会员分享,可在线阅读,更多相关《信息检索基本原理与方法.ppt(68页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、网络信息检索课程 第二讲 信息检索基本原理与方法讲解内容讲解内容信息检索基本原理信息检索基本原理信息检索基本类型信息检索基本类型文献检索基本步骤文献检索基本步骤小结小结检索实例检索实例知识点回顾知识点回顾纸质文献纸质文献标识标识代码代码普通图书(普通图书(Monographs)M会议录会议录(Conferences)C报纸文章(报纸文章(Newspaper)N期刊(期刊(Journals)J学位论文(学位论文(Dissertation)D科技报告(科技报告(Report)R标准(标准(Standards)S专利(专利(Patents)P上一讲重要知识点上一讲重要知识点课堂练习答案课堂练习答案请

2、指出下列文献的文献类型 王蔷.小学英语教学法教程M.M.北京:高等教育出版社,2003 陶仁骥.密码学与数学J.J.自然杂志,1984,7(7):527 Borko H,Bernier C L.Indexing concepts and methodsM.M.New York:Academic Pr,1978.赵均宇.略论辛亥革命前后的章太炎N.N.光明日报,1977-03-24(4)Piterniek A B.Functions and Capabilities of Online Searching Systems:a ChecklistJ.J.Online Review,1989,13(

3、6):466-469.王亚军.整装催化剂及催化转化器若干研究D.D.北京理工大学,2000.辛希孟.信息技术与信息服务国际研讨会论文集:A集C.C.北京:中国社 会科学出 版社,1994.一、信息检索基本原理一、信息检索基本原理从“图灵实验”说起 计算机发展史上有一个重要人物图灵,他在上世纪50年代曾经提出了一个假想的实验,认为计算机可以具有人类的思维能力,被称为“图灵实验”。并且预言,在20世纪末,具有人工智能的计算机将会出现。但时至今日,仍未有任何一台计算机能通过“图灵实验”。信息检索基本原理信息检索基本原理计算机检索的奥妙:关键词匹配 计算机实现检索的奥妙,就在于它能把你输入的检索词,与

4、它后台数据库中存储的文件关键词进行比对,如果能够匹配,就认为这条信息是你需要的,立刻输出给你。信息检索基本原理信息检索基本原理 广广义义的的信信息息检检索索:是是指指将将信信息息按按一一定定的的方方式式组组织织和和存储存储起来,并根据用户的需要起来,并根据用户的需要找出找出相关信息的过程。相关信息的过程。什么是信息检索?信息检索基本原理信息检索基本原理 狭义的信息检索:狭义的信息检索:一个匹配一个匹配(Match)(Match)过程过程 即用户即用户使用检索语言使用检索语言对自己对自己的信息需求的信息需求予以描述予以描述,并在,并在一定的一定的信息资源系统信息资源系统中进行中进行描述匹配描述匹

5、配的过程。的过程。信息存储信息存储原始信息原始信息主题分析主题信息主题信息数据库记录及信数据库记录及信息特征标识息特征标识著录标引计算机计算机类比类比输出输出检索结果检索结果信息检索信息检索信息需求信息需求分析主题分析检索主题检索主题著录标引检检索索提提问问式式及提问标示及提问标示信息检索基本原理信息检索基本原理检索词在数据库纪录中的匹配【题名】碳纳米管应用研究现状与进展 【作者】姜靖雯 彭峰【机构】华南理工大学化学工程系,广东广州510640【刊名】材料科学与工程学报.2003,21(3).-464-468【关键词】碳纳米管 电学性能 场致发射 电子器件 力学性能 储氢材料 催化 剂 锂离子

6、充电电池 电极材料【分类号】O613.71 TB383【文摘】本文综述了近年来碳纳米管在场发射、分子电子器件、复合增强材 料、超级电容器、储氢材料、催化剂材料、锂离子充电电池电极材料 等方面应用研究的现状与进展;并对纳米管的应用前景进行了展望。信息检索基本原理信息检索基本原理二、信息检索基本类型二、信息检索基本类型依信息存储和检索的方式依信息存储和检索的方式手工检索手工检索手工检索手工检索(Manual RetrievalManual Retrieval)也称传统信息检索,是利用各种印刷型检索工也称传统信息检索,是利用各种印刷型检索工具来查找文献的一种方法。具来查找文献的一种方法。计算机检索计

7、算机检索计算机检索计算机检索(Camputer-based RetrievalCamputer-based Retrieval)也称现代信息检索,是指利用计算机和网络来也称现代信息检索,是指利用计算机和网络来处理和查找文献信息的检索方式。处理和查找文献信息的检索方式。信息检索基本类型信息检索基本类型三、文献检索基本步骤三、文献检索基本步骤1.检索准备2.选择检索系统和数据库3.制定检索式和确定检索途径4.实施检索并对检索式进行调整5.筛选文献6.获取全文文献检索基本步骤文献检索基本步骤-明确课题学科属性、专业范围及相关内容 如:超声波技术在兽医学上的应用-弄清检索课题的信息类型和时间要求 即:

8、为文献类检索课题还是事实数据类检索课题 如:沙性土壤植物综合利用工艺 中国经济领域的统计数据、政策、会议名称-考虑课题的特殊要求-明确用户自身的信息要求文献检索基本步骤文献检索基本步骤1 检索准备文献检索基本步骤文献检索基本步骤2 选择检索系统和数据库基本原则-数据库收录的信息内容所涉及的学科范围-数据库收录的文献类型、数量、时间范围及更新周期-数据库提供的检索途径、检索功能和服务方式文献检索基本步骤文献检索基本步骤2 选择检索系统和数据库综合、专业数据库-Derwent Innovations Index(德温特专利数据库)-中华人民共和国国家知识产权局专利检索系统-美国专利与商标局检索系统

9、-欧洲专利局检索系统-世界专利数据库-原文传递2 选择检索系统和数据库专利数据库文献检索基本步骤文献检索基本步骤-Google、百度等搜索引擎(主要查产品类的)-中国科技成果网http:/ 检索系统付费数据库文献检索基本步骤文献检索基本步骤2 选择检索系统和数据库其他资源文献检索基本步骤文献检索基本步骤3 制定检索式和确定检索途径(1)确定检索词 自由词 (任意词)关键词 (专业词、非受控词)主题词 (规范词、受控词、叙词)土豆 发酵制浆 洋芋 微生物制浆 注:检索词还可以包括:作者、机构名称、分类号、出版物名称等。作者、机构名称、分类号、出版物名称等。马铃薯酶法制浆文献检索基本步骤文献检索基

10、本步骤-确定检索词 检索词是检索式的基本组成元素,能否选准、选全检索词直接影响到检索效果的优劣。确定检索词常用的方法是:从给定的课题名称出发,经过切分、删除、补充等步骤,确定检索词,最终通过组配,构成能全面、明确表达信息需求的检索式。文献检索基本步骤文献检索基本步骤-确定检索词切分:对语句进行切分,以词为单位划分句子或词组。删除:删除不具有检索意义的虚词、其他非关键词及过 于宽泛和过于具体的限定词。补充:补充还原词组、同义词和近义词。例:工农业/废水/的/循环利用/的/研究 检索词包括“工业、农业、工农业、废水、循环利用”高速公路/运营/财务/管理/模式/研究 检索词包括“高速公路、高速路、运

11、营、营运、财务”对于需要较高查全率的检索课题,可以以降低检索词的专指度为出发点,补充选用检索词的上位词。文献检索基本步骤文献检索基本步骤3 制定检索式和确定检索途径 (2)构建检索提问式 检索提问式是计算机信息检索中用来表达用户检索提问的逻辑表达式,由检索词和各种布尔逻辑算符、位置算符、截词符以及系统规定的其它组配连接符号组成。用布尔逻辑算符进行检索词的逻辑组配,是一种常用的检索技术。常用的逻辑运算有三种:与、或、非。文献检索基本步骤文献检索基本步骤-布尔逻辑检索1)逻辑“与”用andand、“*”或者空空格格表示。A*B表示同时含有这两个词。在网络搜索引擎中习惯用空格代替*。它可以缩小检索范

12、围提高检准率。文献检索基本步骤文献检索基本步骤-布尔逻辑检索例:输入“中国政府”可以找出包含“中国政府”4个汉字的网站,但像“中国政府”或“中国人民政府”,一般可以输入“中国*政府”、“中国 AND 政府”、“中国 政府”等。2)逻辑“或”用oror、“+”或逗号逗号表示。A+B表示只要有两者中的一个就能满足检索的要求。在网络搜索引擎中习惯用逗号代替+。它可以扩大检索范围,提高检全率。文献检索基本步骤文献检索基本步骤-布尔逻辑检索例:在搜索引擎中输入“计算机 or 多媒体 or Windows XP”则查询至少包含“计算机”、“多媒体”、“Windows XP”三者之一的信息。3)逻辑“非”用

13、notnot 或“”号表示。A not B表示包含A且不包含B。它可以从原来的检索范围中排除不需要的概念,使检索结果更准确。在网络搜索引擎中习惯用减号代替not。文献检索基本步骤文献检索基本步骤例:输入“automobile not car”就要求查询的结果中包含automobile,但同时不能包含car。在搜索引擎中输入“电视台中央电视台”,则查询结果中不包含“中央电视台”。-布尔逻辑检索 截词检索主要是利用检索词的词干或者不完整的词形进行检索,其作用是可扩大检索范围,提高文献的查全率。常用的截词符号有“?”“$”和“*”等。截词检索中使用的截词方式主要有后方截词、前方截词、前后截词和中间截

14、词四种。文献检索基本步骤文献检索基本步骤-截词检索后方截词:comput*可检索computer、computers、computing 等前方截词:*computer可检索 computer、microcomputer等前后截词:?大学?可检索北京大学学报、北京科技大学学报等中间截词:wom?n 可检索woman、women等文献检索基本步骤文献检索基本步骤-截词检索 1(W)、(nW)W:检索词之间不得插入任何词,顺序不能颠倒。如:Al(W)Si(W)Alloy nW:检索词之间可以插入词,顺序不能颠倒。如:electric(1W)vehicles文献检索基本步骤文献检索基本步骤-位置算符

15、 规定检索词在原始文献中相对位置的符号,主要有W、nW、N、F、S等。2(N)、(nN)N:算符两侧的检索词必须紧密相连,中间不能插 入其他词,顺序可以颠倒。如:Chemistry(N)Physics nN:算符两侧的检索词中间可以插入最多n个其他 词,顺序可以颠倒。如:computer(2N)system文献检索基本步骤文献检索基本步骤-位置算符3(S)S:表示其两侧的检索词必须是在文献记录的同一子字段中 ,且不限制它们在该子字段中的相对次序和相对位置的 距离。在文摘字段中,一个句子就是一个子字段。如:computer(W)control(S)system 可检出“This paper is

16、 concerned with a application of the computer control technique in a intelligent system for testing inner walls in pipes.文献检索基本步骤文献检索基本步骤-位置算符 即限定检索词出现的字段 如:AU=作者;LA=语种;TI=篇名;AB=文摘 PY=年代;PN=专利等。文献检索基本步骤文献检索基本步骤-字段符号例如:关键词=科技英语文献检索基本步骤文献检索基本步骤-字段符号(3)确定检索途径文献检索基本步骤文献检索基本步骤3 制定检索式和确定检索途径文献检索基本步骤文献检索基本

17、步骤4 实施检索并对检索式进行调整 检索时,应及时分析检索结果是否与检索要求一致,根据检索结果对检索提问式进行相应的修改和调整,直至得到比较满意的结果。文献检索基本步骤文献检索基本步骤4 实施检索并对检索式进行调整-检索结果信息量过多 a 减少同义词与同族相关词 b 增加限制概念,采用逻辑“与”连接检索词 c 使用字段限定,将检索词限定在某个或某些字段范围 d 使用逻辑“非”算符,排除无关概念 e 调整位置算符,由松变严文献检索基本步骤文献检索基本步骤4 实施检索并对检索式进行调整-检索结果信息量过少 a 选全同义词与相关词并用逻辑“或”将它们连接起来,增加网罗度。b 减少逻辑“与”的运算,丢

18、掉一些次要的或者专指性太 强的概念。c 去除某些字段限制 d 调整位置算符文献检索基本步骤文献检索基本步骤5 筛选文献 详细记录符合检索需求的文献线索,包括文献名称、作者、时间、文献出处、文献类型等。关于检索结果的相关度的判定判断检索词是作为一个精确的词组检索到的,还是在一条记录中被分别检索到的,被精确检索到的相关度高。如果检索词被分别检索到的,被检到的词越接近,该条记录相关度高。词或短语在检索记录中出现的次数,频次高相关度高。检索词是否是在重要的字段中,如标题、关键词字等段。文献检索基本步骤文献检索基本步骤文献检索基本步骤文献检索基本步骤6 获取全文期刊文献-学校订购的数据库(中文数据库如维

19、普、CNKI、万方 数据库等;外文数据库如WorldSciNet、Springer LINK、Elsevier Science等全文电子期刊)-馆藏纸本期刊 -免费资源(如 socolar、DOAJ等)-原文传递-学校订购的数据库文献检索基本步骤文献检索基本步骤文献检索基本步骤文献检索基本步骤-馆藏纸本期刊文献检索基本步骤文献检索基本步骤-免费资源文献检索基本步骤文献检索基本步骤-免费资源文献检索基本步骤文献检索基本步骤-原文传递文献检索基本步骤文献检索基本步骤-原文传递文献检索基本步骤文献检索基本步骤6 获取全文专利文献-Derwent Innovations Index(德温特专利数据库)

20、-中华人民共和国国家知识产权局专利检索系统-美国专利与商标局检索系统-欧洲专利局检索系统-世界专利数据库-原文传递文献检索基本步骤文献检索基本步骤-Derwent Innovations Index 文献检索基本步骤文献检索基本步骤-中华人民共和国国家知识产权局专利检索系统文献检索基本步骤文献检索基本步骤-美国专利与商标局检索系统文献检索基本步骤文献检索基本步骤-欧洲专利局检索系统文献检索基本步骤文献检索基本步骤-世界专利数据库四、检索实例四、检索实例实例:工农业废水的循环利用的研究检索要求:查证国内外关于“农工业废水的循环利 用”情况。检索实例检索实例通过分析得知:“工农业废水的循环利用的研

21、究”属于化学工程、环境工程学科。根据检索要求,查阅的资料范围应为国内外资源(包括期刊文献、专利文献、会议论文、学位论文等),检索的主要内容为“工农业废水的循环利用”方面的研究报道。检索实例检索实例1 检索准备阶段中文中文维普期刊全文数据库中国期刊网数据库CNKI万方数据库检索实例检索实例2 选择数据库外文外文科学引文索引数据库(SCI)Ei village Kluwer Online期刊全文 PQDD(博硕士论文数据库)Springer LINK全文电子期刊 Scifinder Scholar(CA)ACS美国化学学会数据库Derwent Innovations Index-确定检索词确定检索

22、词工业 industry、industrial农业 agriculture、agricultural、farming 工农业 industrial and agricultural废水 wastewater、waste water、effluent循环利用 recycling、recycle检索实例检索实例3 制定检索式-编写检索式编写检索式(工业(工业+农业农业+工农业)工农业)*废水废水*循环利用循环利用(industry or industrial*or agricultur*or farm*)AND(wastewater OR“waste water”OR effluent)AND r

23、ecycl*检索实例检索实例3 制定检索式检索实例检索实例3 确定检索途径(以中文科技期刊数据库为例)检索实例检索实例4 实施检索检索实例检索实例5 筛选文献检索实例检索实例5 获取全文五、小结五、小结*确定检索词及构建检索提问式的方法确定检索词及构建检索提问式的方法 了解“碳纳米管在电极中的应用”情况;查找有关“山楂的食品加工”文献;查找有机锡、有机锑类的塑料热稳定剂资料;煤灰利用;用生物方法防治棉铃虫(排除用赤眼蜂)的文献。本讲重点内容本讲重点内容*确定检索词及构建检索提问式的方法确定检索词及构建检索提问式的方法 比较下列检索式的区别:(工业+农业+工农业)*废水*循环利用 工业+农业+工农业*废水*循环利用本讲重点内容本讲重点内容

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 大学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁