《因特网信息资源检索!2011.ppt》由会员分享,可在线阅读,更多相关《因特网信息资源检索!2011.ppt(21页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第三节第三节因特网信息资源检索因特网信息资源检索阳谷三中阳谷三中 王飞王飞本节课本节课主要内容主要内容主要学习各种搜索引擎及其发展趋势,并主要学习各种搜索引擎及其发展趋势,并在此基础上进一步分析了搜索引擎的工作在此基础上进一步分析了搜索引擎的工作原理。原理。3.1搜索引擎的作用搜索引擎的作用搜索引擎搜索引擎是一种用于帮助因特网用户查是一种用于帮助因特网用户查询信息的搜索工具,它以一定的策略在询信息的搜索工具,它以一定的策略在因特网中搜集、发现信息,对信息进行因特网中搜集、发现信息,对信息进行理解、提取、组织和处理,并为用户提理解、提取、组织和处理,并为用户提供检索服务,从而起到信息导航目的。供
2、检索服务,从而起到信息导航目的。3.2两种检索方式两种检索方式1.目录索引类搜索引擎目录索引类搜索引擎2.全文搜索引擎全文搜索引擎3.3元搜索引擎元搜索引擎元元搜索引擎搜索引擎是一种调用其他多个独立是一种调用其他多个独立搜索引擎的引擎,是对多个独立搜索搜索引擎的引擎,是对多个独立搜索引擎的整合、调用、控制和优化,能引擎的整合、调用、控制和优化,能方便地检索多个搜索引擎,扩大检索方便地检索多个搜索引擎,扩大检索范围,提高检索的全面性。范围,提高检索的全面性。3.3元搜索引擎的特点元搜索引擎的特点元元搜索引擎在搜索的时候,用户只需搜索引擎在搜索的时候,用户只需提交提交一次搜索请求一次搜索请求,而且
3、可以,而且可以同时搜索多个数同时搜索多个数据库据库,并根据多个搜索引擎的检索结果,并根据多个搜索引擎的检索结果进进行二次加工行二次加工,如对检索结果进行重排和标,如对检索结果进行重排和标明检索结果来源等,输出给用户。明检索结果来源等,输出给用户。缺点:缺点:一般支持一般支持ANDAND、OROR、NOTNOT等操作,等操作,一般只使用简单、直接的搜索策略,并且一般只使用简单、直接的搜索策略,并且检索速度也慢。检索速度也慢。3.4搜索引擎的发展趋势搜索引擎的发展趋势1 1、多媒体信息检索、多媒体信息检索 传统的多媒体数据库中,除了文本和数字还包括传统的多媒体数据库中,除了文本和数字还包括图形、图
4、象、声音、视频、动画等各种媒体组合。但图形、图象、声音、视频、动画等各种媒体组合。但多媒体信息具有丰富的内涵,如:多媒体信息具有丰富的内涵,如:图象的颜色、纹理、图象的颜色、纹理、形状形状,动画中的运动、声音和音调动画中的运动、声音和音调等。例如歌曲的等。例如歌曲的旋旋律、音调、音质律、音调、音质等难以用文字描述。这正是基于内容等难以用文字描述。这正是基于内容的音频检索需要研究和解决的问题,以期达到更深的的音频检索需要研究和解决的问题,以期达到更深的检索层次和更好的检索效果。检索层次和更好的检索效果。2 2、专业垂直搜索引擎、专业垂直搜索引擎专业垂直类搜索引擎只面向某一个专业垂直类搜索引擎只面
5、向某一个特特定的领域定的领域,专注于自己的,专注于自己的特长和核心特长和核心技术技术,能够保证对该领域信息的,能够保证对该领域信息的完全完全收录和及时更新收录和及时更新。信息检索工具的工作原理信息检索工具的工作原理搜索引擎是如何搜索信息的呢?你听说过“网络机器人”、“爬虫”、“蜘蛛”吗?他们只是搜索引擎的一个部分,叫“搜索器”三部分的作用三部分的作用1.1.搜索器搜索器:负责定期地自动到各个网站上,:负责定期地自动到各个网站上,把网页抓下来,并顺着页面上的链接,持把网页抓下来,并顺着页面上的链接,持续不断地抓取网页。续不断地抓取网页。2.2.索引器索引器:把搜索器抓来的网页进行分析,:把搜索器
6、抓来的网页进行分析,按照关键词进行索引,并存入服务器的数按照关键词进行索引,并存入服务器的数据库中。据库中。3.3.检索器检索器:面向用户,接受用户提交的查:面向用户,接受用户提交的查询字串,在索引数据库中查询,并将查询询字串,在索引数据库中查询,并将查询结果反馈给用户。结果反馈给用户。全文搜索引擎的工作原理:全文搜索引擎的工作原理:3.3目录索引类搜索引擎目录索引类搜索引擎目录索引类搜索引擎一般采用目录索引类搜索引擎一般采用人工方式人工方式采采集和存储网络信息,依靠集和存储网络信息,依靠手工手工为每个网络为每个网络确定一个标题,并给出大概的描述,建立确定一个标题,并给出大概的描述,建立关键字
7、索引,将其放入相应的类目体系中。关键字索引,将其放入相应的类目体系中。目录索引类搜索引擎一般为一条链状组成目录索引类搜索引擎一般为一条链状组成树型结构:树型结构:总目录总目录 专题目录专题目录 链接链接 网站网站目录索引类搜索引擎最大的目录索引类搜索引擎最大的特点特点就是在查询信息时,事先可以没有就是在查询信息时,事先可以没有特定的信息检索目标(关键词),特定的信息检索目标(关键词),通过浏览主题了解某一主题的相关通过浏览主题了解某一主题的相关资源。资源。目录索引类搜索引擎最大的目录索引类搜索引擎最大的缺点:缺点:分类具有主观性,花费时间多,更分类具有主观性,花费时间多,更新速度慢。新速度慢。
8、选择题选择题1.1.目录索引类搜索引擎一般采用什么方式采目录索引类搜索引擎一般采用什么方式采集和存储信息(集和存储信息()。)。A.A.人工方式人工方式 B.B.蜘蛛程序蜘蛛程序 C.C.关键字检索关键字检索 D.D.检索工具检索工具A2.2.下列不属于搜索引擎中下列不属于搜索引擎中“搜索器搜索器”工作程工作程序的是(序的是()。)。A.A.网络机器人网络机器人 B.B.蜘蛛蜘蛛C.C.爬虫爬虫 D.CuteFTPD.CuteFTPD3.3.下列不属于元搜索引擎特点的是(下列不属于元搜索引擎特点的是()。)。A.A.搜索时,用户必须多次提交搜索请求搜索时,用户必须多次提交搜索请求B.B.可同时
9、搜索多个数据库可同时搜索多个数据库C.C.一般支持一般支持ANDAND、OROR、NOTNOT等操作等操作D.D.一般只使用简单、直接的搜索策略一般只使用简单、直接的搜索策略A判断题判断题1.1.常用的两种搜索引擎是目录类搜索引擎和元搜索引擎。常用的两种搜索引擎是目录类搜索引擎和元搜索引擎。()2.2.为了适应不同搜索群体的需要,许多搜索引擎一般都提为了适应不同搜索群体的需要,许多搜索引擎一般都提供多语种检索功能。供多语种检索功能。()()3.3.通过专业搜索引擎获得的信息资源一般来说比较权威。通过专业搜索引擎获得的信息资源一般来说比较权威。()()4.4.元搜索引擎的搜索范围可以是多个搜索引
10、擎的数据库,元搜索引擎的搜索范围可以是多个搜索引擎的数据库,而不局限于某一搜索引擎的数据库内而不局限于某一搜索引擎的数据库内。()()5.5.元搜索引擎通常只使用高级、间接的搜索策元搜索引擎通常只使用高级、间接的搜索策略,检索速度快。略,检索速度快。()()6.6.垂直搜索引擎只面向某一特定的领域,专注垂直搜索引擎只面向某一特定的领域,专注于自己的特长和核心技术,能够保证对该领域于自己的特长和核心技术,能够保证对该领域信息的完全收录和及时更新。信息的完全收录和及时更新。()()7.7.网页快照是搜索引擎把索引的网页缓存在服网页快照是搜索引擎把索引的网页缓存在服务器中,这样即使链接死了,用户也可以从搜务器中,这样即使链接死了,用户也可以从搜索服务器中取出这个被存储的索服务器中取出这个被存储的“快照网页快照网页”。()小结小结本节课本节课我们主要学习了全文搜索引擎和目我们主要学习了全文搜索引擎和目录搜索引擎的工作原理,希望同学们好好录搜索引擎的工作原理,希望同学们好好理解理解