《信息检索技术的发展与未来.ppt》由会员分享,可在线阅读,更多相关《信息检索技术的发展与未来.ppt(32页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、信息检索技术的发展与未来信息检索技术的发展与未来第一页,编辑于星期六:十六点 十六分。目录 信息检索简介 信息检索技术发展历程 信息检索基本技术第二页,编辑于星期六:十六点 十六分。信息检索及信息检索技术信息检索(Information Retrieval)是指信息按一定的方式组织起来,并根据信息用户的需要找出有关的信息的过程和技术。信息检索技术 是指利用现代信息检索系统,如联机数据库、光盘数据库或网络数据库检索有关信息而采用的相关技术,主要有布尔检索、词位检索、截词检索和限制检索。第三页,编辑于星期六:十六点 十六分。信息检索系统类型参考数据库检索系统全文数据库检索系统Internet网络检
2、索工具第四页,编辑于星期六:十六点 十六分。信息检索系统类型l参考数据库检索系统 参考数据库检索系统以二次文献数据库为主,提供文献的题录、文摘数据和事实数据。l全文数据库检索系统 全文数据库检索系统能提供文献的全文数据,包括图表、图像等多种形式的媒体。lInternet网络检索工具 Internet搜索引擎主要提供网上资源的链接,某些搜索引擎也提供简单的网页介绍或检索词的上下文。第五页,编辑于星期六:十六点 十六分。信息检索的作用能够全面地掌握有关的必要信息,增强决策的科学性;提高信息利用的效率,缩短获取信息的时间;促进社会的进步和经济的发展;信息检索技术能根据用户的查询返回合适的信息,它在一
3、定程度上解决了信息过载的问题。第六页,编辑于星期六:十六点 十六分。文献信息检索的过程Information need信息需求Query信息提问Document objects文献对象Indexed objects标引对象Comparison比较匹配Representation表述Representation标引Retrieved objects检出对象Evaluation/Feedback评估/反馈第七页,编辑于星期六:十六点 十六分。目录 信息检索简介 信息检索技术发展历程 信息检索基本技术第八页,编辑于星期六:十六点 十六分。信息检索的起源和发展过程19c下半叶至20c40s索引和检索图
4、书馆独立工具和用户服务项目1946年,脱机批量情报检索系统、联机实时情报检索系统相继研制成功并商业化20c60s至80s,信息检索在教育、军事、商业各领域得到广泛的运用第九页,编辑于星期六:十六点 十六分。信息检索技术的发展阶段手工检索阶段联机批量处理检索阶段联机检索阶段网络化联机检索阶段发展于19 世纪末。专业化的信息检索产生于参考咨询工作。1954年,初步建成了计算机情报检索系统。1965年ORBIT联机情报检索软件和Dialog检索系统研制成功,实现了国际联机检索。20c90s,实现了将原来的主机系统转移到服务器上。第十页,编辑于星期六:十六点 十六分。信息检索技术的发展趋势智能化信息检
5、索。.智能化信息检索是人们把人工智能与信息检索技 术结合起来应用于信息存取领域的成果。.智能化信息检索原理 .提高智能化检索 第十一页,编辑于星期六:十六点 十六分。信息检索技术的发展趋势可视化信息检索 可视化信息检索包含两个方面:检索过程的可视化 ;检索结果的可视化第十二页,编辑于星期六:十六点 十六分。信息检索技术的发展趋势跨语种信息检索 Cross Language Information Retrieval,CLIR 是指用户用母语提交查询,信息存取系统比如搜索引擎在多语种语言的数据库中进行信息检索,返回能够回答用户问题的所有语言的文档。目前很多主要的搜索引擎已经开始提供不同语种检索:
6、Google Alta Vista Yahoo 第十三页,编辑于星期六:十六点 十六分。信息检索技术的发展趋势个性化信息检索主要体现在以下两个方面:(1)允许信息用户的个性化定制。用户信息基本定制和高级定制。(2)基于数据挖掘技术对信息用户,的检索行为进行分析,挖掘出信息用户的检索需求,用推送技术(Push)主动向用户推送所需要的信息资源第十四页,编辑于星期六:十六点 十六分。信息检索技术的发展趋势 总之,信息检索技术的发展趋势必将以信息技术的发展和信息用户的信息检索需求为出发,在理念、人性化、智能化等方面取得全面突破,不断吸收信息技术上的最新成果和理解人们的需求,逐渐适应人脑的思维方式,实现
7、智能、高效、快速、全面而灵活的信息检索,最后达到随心所欲地查找、迅速获取所需信息的水平,使信息资源得到更为合理的开发和利用。第十五页,编辑于星期六:十六点 十六分。目录 信息检索简介 信息检索技术发展历程 信息检索基本技术第十六页,编辑于星期六:十六点 十六分。信息检索基本技术1 布尔逻辑检索(Boolean logic)布尔逻辑检索一般指布尔逻辑检索一般指“与与”、“或或”、“非非”三种运算。三种运算。第十七页,编辑于星期六:十六点 十六分。逻辑逻辑“与与”的布尔运算符为的布尔运算符为“ANDAND”、“andand”,有时也可用有时也可用“*”表示。其含义是表示。其含义是“与与”前后的检索
8、词全部出现时,所检前后的检索词全部出现时,所检索到的结果才算符合条件。索到的结果才算符合条件。AANDB 或者或者 A*B 检索时,数据库中同时含有检索词检索时,数据库中同时含有检索词A A和检索词和检索词B B的文献,的文献,为命中文献。为命中文献。信息检索基本技术第十八页,编辑于星期六:十六点 十六分。逻辑逻辑“或或”的布尔运算符为的布尔运算符为“OROR”、“oror”,有时也可用有时也可用“+”表示。其含义是表示。其含义是“或或”前后的检索词有一个出现或全前后的检索词有一个出现或全部出现,所检索到的结果均算符合条件部出现,所检索到的结果均算符合条件 A OR BA OR B 或者或者
9、A+BA+B 检索时,数据库中的文献凡含有检索词检索时,数据库中的文献凡含有检索词A A或者检索或者检索词词B B或者同时含有检索词或者同时含有检索词A A和和B B的,均为命中文献。的,均为命中文献。信息检索基本技术第十九页,编辑于星期六:十六点 十六分。逻辑逻辑“非非”的布尔运算符为的布尔运算符为“NOTNOT”、“notnot”,有时也可用有时也可用“-”符号表示。其含义是搜索结果应满足符号表示。其含义是搜索结果应满足“NOTNOT”前面的检索前面的检索词而排除词而排除“NOTNOT”后面的检索词。后面的检索词。A NOT BA NOT B 或者或者 A-BA-B对于这个提问式,数据库中
10、凡含有检索词对于这个提问式,数据库中凡含有检索词A A而不含有检索词而不含有检索词B B的文献,即为命中文献。的文献,即为命中文献。信息检索基本技术第二十页,编辑于星期六:十六点 十六分。2 词组检索(phrase search)词组检索(词组检索(phrase),),也称为短语检索,或字符串检索。它也称为短语检索,或字符串检索。它是将一个词组或短语用双引号是将一个词组或短语用双引号“”括起作为一个独立运算单元,括起作为一个独立运算单元,进行严格匹配,以提高检索准确度的一种方法。几乎所有的搜索进行严格匹配,以提高检索准确度的一种方法。几乎所有的搜索引擎都支持词组检索。引擎都支持词组检索。“co
11、mputer networkcomputer network”“山东大学管理学院山东大学管理学院”信息检索基本技术第二十一页,编辑于星期六:十六点 十六分。3 截词检索(truncation search)所谓截词(所谓截词(truncationtruncation),),是指检索者将检索词在他认是指检索者将检索词在他认为合适的地方截断;而截词检索,则是用截断的词的一个局部为合适的地方截断;而截词检索,则是用截断的词的一个局部进行的检索,凡满足这个词局部中的所有字符(串)的文献,进行的检索,凡满足这个词局部中的所有字符(串)的文献,都为命中的文献。都为命中的文献。后截断后截断 前截断前截断 中
12、间截断中间截断 信息检索基本技术第二十二页,编辑于星期六:十六点 十六分。例例1 system?这是一个两个字符有限截断检索,该表达式可检出的词汇有:这是一个两个字符有限截断检索,该表达式可检出的词汇有:system systemic但不能检索出下列词汇但不能检索出下列词汇 systematicsystematicalsystematicianSystematics 有限截断有限截断信息检索基本技术第二十三页,编辑于星期六:十六点 十六分。无限截断无限截断例例2 comput*这是一个无限后截断的例子。这种方法可以查找出含有相同字符串的所有检索词。这是一个无限后截断的例子。这种方法可以查找出含
13、有相同字符串的所有检索词。Comput*可检出词汇有可检出词汇有computabilitycomputablecomputationcomputationalcomputativecomputecomputer信息检索基本技术第二十四页,编辑于星期六:十六点 十六分。2)前截断 与后截断相对,前截断是将截词符号置放在一个字符与后截断相对,前截断是将截词符号置放在一个字符串左方,以表示截词符左面的有限或无限个字符不影响该串左方,以表示截词符左面的有限或无限个字符不影响该字符串的检索。这种方式称为检索词的前截断。从检索性字符串的检索。这种方式称为检索词的前截断。从检索性质上讲,前截断是后方一致检索
14、。质上讲,前截断是后方一致检索。信息检索基本技术第二十五页,编辑于星期六:十六点 十六分。例例3.*magnetic这是一个无限前截断的表达式,可检出下列词汇:这是一个无限前截断的表达式,可检出下列词汇:magnetic有磁性的有磁性的electro-magnetic电磁的电磁的electromagnetic电磁的电磁的paramagnetic顺磁的顺磁的thermo-magnetic热磁的热磁的thermomagnetic热磁的热磁的但是检索不出但是检索不出magneticsmagnetical等等。等等。信息检索基本技术第二十六页,编辑于星期六:十六点 十六分。3 3)中间截断中间截断 中
15、间截断又称为中间屏蔽,是一种用截中间截断又称为中间屏蔽,是一种用截词符屏蔽词中不同字符的方法。例如,词符屏蔽词中不同字符的方法。例如,“woman”和和“women”,可用可用“wom?n”代替;代替;“defence”和和“defense”,可用可用“defen?e”代替。代替。一般地,中间截词仅允许有限截断。一般地,中间截词仅允许有限截断。信息检索基本技术第二十七页,编辑于星期六:十六点 十六分。4 4 字段限定检索字段限定检索(field limiting)field limiting)字段检索(字段检索(field)是一种用于限定提问关键词在是一种用于限定提问关键词在数据库记录中出现的
16、区域,控制检索结果的相关性,数据库记录中出现的区域,控制检索结果的相关性,提高检索效果的检索方法,多以字段限定方式实现。提高检索效果的检索方法,多以字段限定方式实现。信息检索基本技术第二十八页,编辑于星期六:十六点 十六分。字段代码字段代码 字段名称字段名称ABAB Abstract Abstract 文摘文摘AUAU Author Author 作者作者CC CC Classification Code Classification Code 分类代码分类代码CS CS Corporate Source Corporate Source 机构名称机构名称DE DE Descriptor De
17、scriptor 叙词叙词DT DT Document Type Document Type 文献类型文献类型ID ID Identifier Identifier 标识词标识词JN JN Journal Name Journal Name 刊名刊名LA LA Language Language 语种语种PY PY Publication Year Publication Year 出版年出版年TI TI Title Title 题名题名 如在如在DIALOGDIALOG系统中,情况是这样的:系统中,情况是这样的:信息检索基本技术第二十九页,编辑于星期六:十六点 十六分。例例4minicomp
18、uter/TIANDJohn/AUANDpy=2002表达的检索要求是:表达的检索要求是:查找查找2002年出版的年出版的John写的关于微电脑文献,并要求写的关于微电脑文献,并要求“微电脑微电脑”一词一词在命中文献的题名字段出现,在命中文献的题名字段出现,“John”出现在作者字段。这里出现在作者字段。这里“/TI”、“/AU”是后缀符的用法;是后缀符的用法;“py=”是前缀符的用法,且是前缀符的用法,且”py=2002”是作是作为一个检索词写入检索式的。为一个检索词写入检索式的。信息检索基本技术第三十页,编辑于星期六:十六点 十六分。参考文献1曹鹏.现代信息检索技术发展探析J.高等函授学报,2010(23).2孔燕,刘成新,杨磊.信息检索技术的发展与教育应用探讨J.现代教育技术,2009(13).3王冉.信息检索技术在高校图书馆的应用J.图书馆工作研究,2010(20).4王倩.浅谈信息检索前沿发展的几个问题J.图书馆论坛.5胡伶霞.现代信息检索技术发展探讨J.农业图书情报学刊6卢文林.信息检索技术发展概况J.农业图书情报学刊,2003(3)第三十一页,编辑于星期六:十六点 十六分。Thank you!第三十二页,编辑于星期六:十六点 十六分。