2022年中文搜索引擎的十大误区搜索研究教程.docx

上传人:l*** 文档编号:63203030 上传时间:2022-11-23 格式:DOCX 页数:4 大小:12.72KB
返回 下载 相关 举报
2022年中文搜索引擎的十大误区搜索研究教程.docx_第1页
第1页 / 共4页
2022年中文搜索引擎的十大误区搜索研究教程.docx_第2页
第2页 / 共4页
点击查看更多>>
资源描述

《2022年中文搜索引擎的十大误区搜索研究教程.docx》由会员分享,可在线阅读,更多相关《2022年中文搜索引擎的十大误区搜索研究教程.docx(4页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、2022年中文搜索引擎的十大误区搜索研究教程误区1、网站书目就是搜寻引擎 网站书目通常是经过人工分类的有系统的网站列表,通常附带有搜寻功能。网站书目就是搜寻引擎的名词始于雅虎,雅虎初创时就是只有一个网站书目。当然很快就通过外包的形式增加了网页级的搜寻。中文网站供应书目搜寻的远多于供应网页搜寻的,加之媒体的各种炒作,很多网民误以为网站书目的搜寻功能就是搜寻引擎。在美国,因特网搜寻引擎通常指的是收集了因特网上几千万到几亿个网页并对网页中的每一个词进行索引的搜寻服务系统,是基于网页的全文检索系统。误区2、搜寻引擎就是门户站点假如你要供应搜寻服务,大家就认为你是一个门户网站,你就要吸引用户、提高页视率

2、(PageView)。事实上,搜寻引擎完全可以为内容供应商(ICP)、门户网站供应专业的搜寻服务,而不必干脆面对用户,这是一种典型的应用服务供应(ASP)模式。误区3、搜寻引擎的概念已经过时搜寻引擎是互联网上最先商业化的一个应用服务,它对于帮助网民快速找寻到所须要的信息特别关键。因特网搜寻引擎是一个全自动的软件服务,并且特别简单在搜寻结果网页中插入具有很高针对性的广告,CPM 最高可达70美元;所以一旦投入运转,其收益与成本的比率远高于一般的网站内容服务。依据中国互联网信息中心(CNNIC)2000年1月的统计结果,在中国网民中,搜寻是排在电子邮件之后的其次大互联网应用。误区4、中文搜寻引擎技

3、术已经成熟不要说中文,即使英文的搜寻引擎也没有发展成熟。这一方面表现在新的搜寻引擎公司层出不穷,如Google, Ask Jeeves等;另一方面更表现在美国前三大网站都外包了它们的网页搜寻部分。事实上,美国在线、雅虎和微软网络的搜寻服务都是由一家叫Inktomi 的公司供应的。这是因为搜寻引擎技术改变特别快,这些网站无法自行跟踪最前沿的技术。之所以有人会有搜寻引擎技术已经成熟的概念,其实是因为网站门户公司意识到了它们的特长并不是搜寻技术的创新,而是互联网上大众品牌的建立。中文搜寻引擎技术出现的时间并不比英文的晚多少,然而发展速度却远远赶不上英文,这是由于网页级搜寻引擎的开发难度相当大,该方面

4、的专业人才奇缺,有开发这种搜寻引擎阅历的人,即使在硅谷也属凤毛麟角,开发所须要的硬件要求也比一般的网页制作高出许多。百度公司结合硅谷搜寻引擎人才精英,依托北京最优秀的软件人才,开发了大型商业化的中文搜寻引擎,中文搜寻从今与英文站在了同一起跑线上。误区5、中文搜寻引擎速度很慢某些中文网站的网页搜寻服务外包给了一些服务器在境外的应用服务供应商(ASP),如AltaVista或Openfind等, 由于用户搜寻须要占用出国带宽,因而速度极慢。这不是中文搜寻引擎的错,而是这些网站没有选对ASP 所致。误区6、中英文混合检索词是不被支持的当你输入“MP3” 时,有些网站会认为你在查找英文网页,进而自动将

5、你送到一个英文搜寻引擎上;更多的网页搜寻服务不能对“甲A”、“F-1一级方程式”等中英混合查询作出恰当的反应。然而搜寻技术并非对此无能为力,百度搜寻就完全解决了中英文混查的问题。误区7、中文搜寻引擎的相关性无法与英文相媲美中文与英文最大的不同之处在于中文中有词的概念,检索字串与网页中文字的简洁匹配并不见得就是语义上的匹配;要想提中学文搜寻的相关性,必需结合中文词和中文字,并运用一些先进的算法,如新一代信息检索(IR)算法、超链分析(Link Analysis)等。中文搜寻也有很多英文搜寻望尘莫及之处,如中文网页极少有针对搜寻引擎的欺瞒(Spamming)行为,中文没有单复数、时态等的改变,大多数先进的算法也完全适用于中文。中文搜寻的相关性完全可以与英文媲美。百度搜寻运用了目前国际上先进的搜寻引擎技术,并结合中文的语言特点和文化特点,胜利地解决了中文搜寻的相关性问题。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > 工作计划

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁