搜索引擎的发展历程、工作原理及趋势,搜索引擎论文.docx

上传人:安*** 文档编号:73301655 上传时间:2023-02-17 格式:DOCX 页数:8 大小:19.31KB
返回 下载 相关 举报
搜索引擎的发展历程、工作原理及趋势,搜索引擎论文.docx_第1页
第1页 / 共8页
搜索引擎的发展历程、工作原理及趋势,搜索引擎论文.docx_第2页
第2页 / 共8页
点击查看更多>>
资源描述

《搜索引擎的发展历程、工作原理及趋势,搜索引擎论文.docx》由会员分享,可在线阅读,更多相关《搜索引擎的发展历程、工作原理及趋势,搜索引擎论文.docx(8页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、搜索引擎的发展历程、工作原理及趋势,搜索引擎论文随着计算机网络技术的飞速发展,人们要在互联网的海量信息中查找自个所需的信息,就要使用搜索引擎,搜索引擎已经成为人们获取信息的重要手段。 搜索引擎从广义的角度来讲,是指互联网上提供用户检索接口并且具有检索功能的网站,它能帮助人们在互联网中查找到所需要的信息;从狭义的角度来讲,搜索引擎是指根据某种策略、运用特定的计算机程序从网络上搜集要查找的信息, 对信息进行组织和处理后,为用户提供检索服务,将用户检索的相关信息展现给用户的系统。 1搜索引擎的发展历程 搜索引擎是伴随互联网的发展而产生和发展的,互联网已成为人们学习、工作和生活中不可缺少的平台,几乎每

2、个人上网都会使用搜索引擎。 搜索引擎大致经历了四代的发展。 1.1 第一代搜索引擎 1994 年第一代真正基于互联网的搜索引擎 Lycos 诞生,它以人工分类目录为主,代表厂商是 Yahoo,特点是人工分类存放网站的各种目录,用户通太多种方式寻找网站,如今也还有这种方式存在。 1.2 第二代搜索引擎 随着网络应用技术的发展,用户开场希望对内容进行查找,出现了第二代搜索引擎,也就是利用关键字来查询。最具代表性、最成功的是 Google,它建立在网页链接分析技术的基础上,使用关键字对网页搜索,能够覆盖互联网的大量网页内容,该技术能够分析网页的重要性后,将重要的结果呈现给用户。 1.3 第三代搜索引

3、擎 随着网络信息的迅速膨胀,用户希望能快速并且准确的查找到自个所要的信息,因而出现了第三代搜索引擎。相比前两代,第三代搜索引擎愈加注重个性化、专业化、智能化,使用自动聚类、分类等人工智能技术,采用区域智能辨别及内容分析技术,利用人工参与,实现技术和人工的完美结合,加强了搜索引擎的查询能力。 第三代搜索引擎的代表是 Google,它以宽广的信息覆盖率和优秀的搜索性能为发展搜索引擎的技术创始了崭新的局面。 1.4 第四代搜索引擎 随着信息多元化的快速发展,通用搜索引擎在当前的硬件条件下要得到互联网上比拟全面的信息是不太可能的,这时,用户就需要数据全面、更新及时、分类细致的面向主题搜索引擎,这种搜索

4、引擎采用特征提取和文本智能化等策略, 相比前三代搜索引擎更准确有效,被称为第四代搜索引擎1. 2搜索引擎的分类 搜索引擎按工作方式分为三类:目录索引类搜索引擎、全文搜索引擎和元搜索引擎2. 2.1 目录索引类搜索引擎 目录索引类搜索引擎的数据库是人工建立的,工作人员访问过某个 web 网站后根据自定的一套评判准则对这个网站进行描绘叙述,并根据站点的性质和内容归类到预先分好的类别,再将其存放在对应的目录中,用户既能够通过本文关键词语查询,可以以按目录逐层检索。由于目录索引类数据库是人工评价某个网站的内容,所以相比基于 Robot 搜索引擎搜索到的结果,用户通过目录搜索的结果更具有参考价值。 当下

5、大部分搜索网站既提供基于 Robot 的搜索服务,又提供基于目录的搜索服务,以尽可能为用户提供全面的查询结果。 2.2 全文搜索引擎 当前全文搜索引擎是主流的搜索引擎,人们经常讲的搜索引擎一般都是指全文搜索引擎,典型的代表有 Google、百度、搜狗等。 这类搜索引擎利用网络蜘蛛在网络中搜索,再抓取原始网页,存放于本地数据库并对原始网页进行加工,然后建立网页内容索引。 系统在检索阶段,索引后台数据库并寻找和用户查询条件相匹配的网页,把这些网页根据相应规则排序后将结果按顺序返回给用户。在搜索引擎的界面上,用户输入要查询的关键字,就能够找到互联网中与之相关的网页。 2.3 元搜索引擎 元搜索引擎是

6、将用户的搜索请求同时提交给多个独立搜索引擎,然后集中处理搜索结果,按统一格式返回给用户,故又被称为搜索引擎之上的搜索引擎。 该搜索引擎的特点是本身不保存网页信息内容,假如有用户输入查询请求,它把请求转换成其它搜索引擎能够接受的命令格式,同时访问多个搜索引擎查询该本文关键词语,最后将搜索引擎返回的结果处理后提交给用户。 总之,目录索引类搜索引擎的缺点是信息覆盖量不大、更新慢,元搜索引擎要等待所有搜索引擎提交结果并进行处理, 速度通常比拟慢,因而全文搜索引擎是人们研究的重点。 3搜索引擎的工作原理 搜索引擎通常由搜索器、索引器、检索器和用户接口四部分组成3.系统先由搜索器收集网页内容,再通过索引器

7、分析收集的内容并建立索引,然后由检索器响应用户的检索请求,当用户输入查询关键字后,搜索器用关键字与索引器进行匹配,作相关性排序后通过用户接口给用户返回结果。 搜索引擎的工作流程能够简单的描绘叙述为:网络蜘蛛定期在互联网上爬行,当发现新的页面时,将其取出并存放到本地数据库中,用户可通过查询本地数据库得到结果。大致可概括为抓取网页、加工整理、查询服务三个阶段。 抓取网页阶段:每个独立的搜索引擎都有自个的网络蜘蛛,它每隔一定的时间自动启动,从数据库获得 URL 列表,根据某种策略抓取列表指定的网站,并将抓到的网页存入数据库,然后把新的 URL 存入数据库。 理论上,从一定范围网页出发,就能够搜集到绝

8、大多数网页。 加工整理阶段:搜索引擎抓到网页后,再做大量的预处理工作,对网页文档建立倒排索引,将索引更新到索引数据库,并提取网页链接信息,存入链接数据库,为网页评级做准备。 查询服务阶段:搜索引擎待用户输入本文关键词语,从索引数据库找到匹配该本文关键词语的网页,通过网页评级对结果进行排序处理,最后将结果反应给用户。 搜索引擎的实现经过包括四部分:从互联网抓取网页 建立索引数据库 在数据库中搜索 对搜索结果排序。 搜索引擎的网络蜘蛛会定期访问所有的网页来更新网页索引数据库,去除死链接,并根据网页链接关系和内容的变化重新排序。 最终网页内容的变化情况将反映在用户查询结果中4. 4搜索引擎的发展趋势

9、 4.1 提高搜索引擎的智能化水平 智能搜索引擎是利用人工智能技术对用户的查询意图、兴趣等推理,用获得的知识对信息进行过滤搜集,把用户感兴趣的信息提交给用户。 通过智能算法进行人与计算机的对话,利用机器翻译技术强化自然语言的处理能力,通过语义理解用户自然语言的需求。 智能代理技术能够不断适应用户兴趣变化,并提供个性化的服务。 4.2 提供优化的检索结果 利用搜索引擎规则,搜索引擎优化能够提高网站在搜索引擎中的排名,针对检索网页的特点,根据搜索引擎的检索原则调整网站的基本要素,使其在自然检索结果中排名靠前,进而到达推广网站的目的。 4.3 多媒体搜索引擎 随着搜索引擎技术的发展,搜索引擎除检索文

10、本外,还要检索多媒体数据,当前很多公司投入资金解决该技术的系统模型优化、图像声音特征相关性研究、多媒体特征提取等问题,进而开发能够查询图像、图片、声音等内容的搜索引擎,这项技术是将来搜索引擎发展的必然趋势5. 5总结 随着计算机网络搜索技术的飞速发展,人们对搜索引擎的要求也越来越高,将来的搜索引擎要求速度更快、精度更高层次,更能知足用户查询信息的个性化需求,使得互联网用户能够享遭到愈加高效的人性化的网络搜索服务。 【以下为参考文献】 1高凯, 郭立炜, 许云峰。 网络信息检索技术及搜索引擎系统开发M. 北京: 科学出版社,2018. 2勾智楠, 赵丁。基于。NET 搜索引擎的研究与应用J.数字化用户,20201。 3李宜志。搜索引擎 Google 与 Bing 的比拟J.科技资讯,2018. 4谢虹,张彦芳。浅谈互联网搜索引擎的使用J.科技信息,2018. 5邢国军,刘林霞。浅谈网络搜索引擎J.科技信息,2018.

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > 毕业论文 > 农业相关

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁