《第五章网络信息检索.ppt》由会员分享,可在线阅读,更多相关《第五章网络信息检索.ppt(30页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第五章网络信息检索第五章网络信息检索一、网络信息资源一、网络信息资源网络信息资源的特点网络信息资源的特点网络信息资源的类型网络信息资源的类型1。网络信息资源的特点。网络信息资源的特点无序性无序性开放性开放性动态性动态性多样性多样性用户广用户广2。网络信息资源的类型。网络信息资源的类型(1)按信息的内容划分为:)按信息的内容划分为:政府信息,科研信息,教育信息,文化信息,娱乐消闲信息政府信息,科研信息,教育信息,文化信息,娱乐消闲信息等等(2)按采用的网络传输协议不同划分为:)按采用的网络传输协议不同划分为:万维网信息资源,万维网信息资源,Telnet信息资源,信息资源,FTP 信息资源,用户服
2、信息资源,用户服务组信息资源,务组信息资源,Gopher 信息资源信息资源(3)按网络信息资源传播范围划分)按网络信息资源传播范围划分:光盘局域网信息资源光盘局域网信息资源 传统联机检索信息资源传统联机检索信息资源 Internet网络信息网络信息二、网络信息检索工具二、网络信息检索工具1。网络信息检索工具及一般构成。网络信息检索工具及一般构成网络信息检索工具是指在因特网上提供信息检索服务的计算网络信息检索工具是指在因特网上提供信息检索服务的计算机系统,其检索对象是存在于因特网信息空间中各种类型的机系统,其检索对象是存在于因特网信息空间中各种类型的网络信息资源。网络信息资源。早期的搜寻早期的搜
3、寻FTP资源的资源的Archie,检索,检索Gopher网站资源的网站资源的Veronica和和Jughead,查询查询 Usenet新闻组资源的新闻组资源的WAIS等,等,以及以及Yahoo,Alta Vista,Lycos等等 Web检索工具。检索工具。所谓所谓Web检索工具是指利用超文本(超媒体)技术在因特网检索工具是指利用超文本(超媒体)技术在因特网上提供网上信息资源导航、检索服务的专门上提供网上信息资源导航、检索服务的专门Web 服务器或服务器或网站。由于网站。由于Web检索工具既以检索工具既以Web 形式提供服务,又以形式提供服务,又以Web资源为检索对象,检索范围还涉及其他网络资
4、源形式,资源为检索对象,检索范围还涉及其他网络资源形式,如如Usenet,Gopher,FTP等,所以等,所以Web检索工具成为人们检索工具成为人们获取因特网信息资源的主要检索工具和手段。获取因特网信息资源的主要检索工具和手段。网络信息检索工具的一般构成网络信息检索工具的一般构成自动索引程序:自动索引程序:大多数网络检索工具一般采用一种称为大多数网络检索工具一般采用一种称为Robot(又称又称Spider,Crawler,Worms,Wanders等)的网络自动跟踪索等)的网络自动跟踪索引程序引程序数据库:数据库:自动索引程序将采集和标引的信息汇集成数据库,作为自动索引程序将采集和标引的信息汇
5、集成数据库,作为该网络检索工具提供检索服务的基础。不同的网络检索该网络检索工具提供检索服务的基础。不同的网络检索工具的数据库的收录范围不同,标引方式也不同,规模工具的数据库的收录范围不同,标引方式也不同,规模大小不同。大小不同。检索代理软件:检索代理软件:当用户提出检索查询时,由检索软件负责代理用户在数当用户提出检索查询时,由检索软件负责代理用户在数据库中进行检索。不同的网络检索工具所采用的检索机据库中进行检索。不同的网络检索工具所采用的检索机制、算法有所不同,布尔逻辑检索是较普遍采用的一种制、算法有所不同,布尔逻辑检索是较普遍采用的一种机制。机制。2。网络信息检索工具的类型:。网络信息检索工
6、具的类型:网络检索工具一般可分为:网络检索工具一般可分为:Web 资源检索工具:以资源检索工具:以Web 资源为主要检资源为主要检索对象索对象,又以又以Web形式提供的检索工具。形式提供的检索工具。非非Web 资源检索工具:即以非资源检索工具:即以非Web 资源为资源为检索对象的检索工具,检索对象的检索工具,Archie,Veronica,WAIS 等。等。Web 资源检索工具资源检索工具(1)目录型检索工具)目录型检索工具(subject directory)(2)搜索引擎)搜索引擎(search engine)(3)多元搜索引擎)多元搜索引擎(metasearch engine)(1)目录
7、型检索工具()目录型检索工具(subject directory)目录型检索工具也称作目录型检索工具也称作catalogue目录型检索工具目录型检索工具 是按照某种主题分类体系编制的一种可供检是按照某种主题分类体系编制的一种可供检索的的等级结构式目录。在每个目录类及子类下提供相应的索的的等级结构式目录。在每个目录类及子类下提供相应的网络资源站点地址,并给以简单的描述。网络资源站点地址,并给以简单的描述。优优点点:目目录录型型检检索索工工具具经经过过信信息息管管理理专专业业人人员员、分分类类专专家家的的人人工工设设计计和和编编制制,所所收收录录的的网网络络资资源源经经过过专专业业人人员员的的鉴鉴
8、别别、选择和组织,保证了检索工具的质量,提高了检索的准确性。选择和组织,保证了检索工具的质量,提高了检索的准确性。局限性:局限性:其其更更新新、维维护护的的速速度度或或周周期期要要受受系系统统人人员员工工作作时时间间的的制制约约,导导致致检检索索工具的新颖性不够;工具的新颖性不够;若若用用户户不不熟熟悉悉其其分分类类体体系系或或对对类类分分标标准准理理解解与与系系统统人人员员不不一一致致,就就会会影响其检索;影响其检索;在某些主题下收录范围不够全面,使检索到的信息数量有限。在某些主题下收录范围不够全面,使检索到的信息数量有限。目目录录型型检检索索工工具具比比较较适适合合于于查查找找综综合合性性
9、、概概括括性性的的主主题题概概念念,或或对对检检索索准准确确度度要要求求较较高高的的课课题题。最最著著名名的的目目录录型型检检索索工工具具是是Yahoo!(URL:www yahoocom)。(2)搜索引擎(搜索引擎(search engine)搜索引擎的工作原理:搜索引擎的工作原理:发现、搜集网页信息。首先需要有高性能的发现、搜集网页信息。首先需要有高性能的Robot程序去程序去自动地在互联网中搜索信息自动地在互联网中搜索信息 索引库的建立。建立信息索引就是创建文档信息的特征索引库的建立。建立信息索引就是创建文档信息的特征记录,使检索者能够快速地检索到所需信息记录,使检索者能够快速地检索到所
10、需信息 检检索索及及结结果果输输出出。代代替替用用户户在在数数据据库库中中查查找找出出与与提提问问匹匹配的记录,并返回结果且按相关度排序输出。配的记录,并返回结果且按相关度排序输出。搜索引擎的特点:搜索引擎的特点:由由自自动动索索引引软软件件生生成成数数据据库库,收收录录、加加工工信信息息的的范范围围广广、速度速度 快,能及时地向用户提供新增信息。快,能及时地向用户提供新增信息。检检索索时时直直接接输输入入关关键键词词或或词词组组、短短语语,无无需需判判断断类类目目归归属,比较方便属,比较方便。局限性:局限性:但由于标引过程缺乏人工干预,准确性较差,加之检索但由于标引过程缺乏人工干预,准确性较
11、差,加之检索软件的智能化程度又不很高,导致检索误差较大;软件的智能化程度又不很高,导致检索误差较大;虽一次检索输出的结果可能很多,但会包含许多的重复、虽一次检索输出的结果可能很多,但会包含许多的重复、虚假信息,即检索噪音较大。虚假信息,即检索噪音较大。不同的搜索引擎有不同的检索项选择、不同的搜索引擎有不同的检索项选择、检索界面,不同检索界面,不同的句法要求和对符号、标识符的处理,因此检索策略的的句法要求和对符号、标识符的处理,因此检索策略的构造和输入方式也会直接影响检索结果。构造和输入方式也会直接影响检索结果。搜索引擎适合于检索特定的信息及较为专、深、具搜索引擎适合于检索特定的信息及较为专、深
12、、具体或类属不明确的课题。体或类属不明确的课题。较有代表性的英文搜索引擎有较有代表性的英文搜索引擎有AltaVista,Excite,Lycos,Hotbot等。等。目录型检索工具和搜索引擎之间的界限越来越模糊:目录型检索工具和搜索引擎之间的界限越来越模糊:大多数流行的网络检索工具同时提供两种方式的检索,从大多数流行的网络检索工具同时提供两种方式的检索,从而将目录型工具的组织、导引功能与搜索引擎的检索功能而将目录型工具的组织、导引功能与搜索引擎的检索功能更好地结合起来。这种担负了网络资源主题指南和索引双更好地结合起来。这种担负了网络资源主题指南和索引双重责任的混合型检索工具似乎代表了网络检索工
13、具的发展重责任的混合型检索工具似乎代表了网络检索工具的发展趋势。趋势。如:著名的目录型检索工具如:著名的目录型检索工具 Yahoo!曾与搜索引擎的典型代曾与搜索引擎的典型代表表AltaVista相挂接,当检索提问在相挂接,当检索提问在Yahoo!的分类目录指南的分类目录指南数据库中未找到相关的记录时,可自动转向数据库中未找到相关的记录时,可自动转向AltaVista的索的索引数据库中继续检索,并将有关的结果提供给用户,从而引数据库中继续检索,并将有关的结果提供给用户,从而加强了加强了Yahoo!的检索功能。的检索功能。其他一些著名的搜索引擎,如:其他一些著名的搜索引擎,如:Excite,Lyc
14、os,Magellan,WebCrawler等均在过去主要等均在过去主要 提供索引服务的基础上,提供索引服务的基础上,增设了各种形式的分类目录,以强化其组织、导引、浏览增设了各种形式的分类目录,以强化其组织、导引、浏览等功能。这种发展趋势使得许多用户已将上述两种工具混等功能。这种发展趋势使得许多用户已将上述两种工具混为一谈,均称为搜索引擎。为一谈,均称为搜索引擎。(3)多元搜索引擎)多元搜索引擎(metasearch engine)多元搜索引擎多元搜索引擎(metasearch engine或或megasearch engine)又称为集合式搜索引擎。多元搜索引擎是将多个搜索引擎集又称为集合式
15、搜索引擎。多元搜索引擎是将多个搜索引擎集成在一起,并提供一个统一的检索界面。它可分为两种类型:成在一起,并提供一个统一的检索界面。它可分为两种类型:搜索引擎目录搜索引擎目录和和元搜索引擎元搜索引擎。搜索引擎目录:搜索引擎目录:也即检索工具的检索工具,它将主要的搜索引擎集中起来,也即检索工具的检索工具,它将主要的搜索引擎集中起来,并按类型或按检索问题等编排组织成目录,帮助、导引用户并按类型或按检索问题等编排组织成目录,帮助、导引用户根据检索需求来选择适用的搜索引擎。根据检索需求来选择适用的搜索引擎。它集中罗列检索工具,并将用户导引到相应的工具去检索;它集中罗列检索工具,并将用户导引到相应的工具去
16、检索;检索的还是某一搜索引擎自己的数据库,与普通单一搜索引检索的还是某一搜索引擎自己的数据库,与普通单一搜索引擎的检索是一样的。只不过是设立了又一层门户,通过其组擎的检索是一样的。只不过是设立了又一层门户,通过其组织、检索界面,为用户选择适用的检索工具提供积极的帮助,织、检索界面,为用户选择适用的检索工具提供积极的帮助,以克服用户面对众多的检索工具的无所适从。较典型的搜索以克服用户面对众多的检索工具的无所适从。较典型的搜索引擎目录有:引擎目录有:All-in-One,CUSI,iTools!等。等。元搜索引擎元搜索引擎 是将多个搜索引擎集成在一起,提供一个统一的检索界面;且将一个检索是将多个搜
17、索引擎集成在一起,提供一个统一的检索界面;且将一个检索提问同时发送给多个搜索引擎,同时检索多个数据库,再经过聚合,去重提问同时发送给多个搜索引擎,同时检索多个数据库,再经过聚合,去重之后输出检索结果。它是一种集中检索的方式,与之后输出检索结果。它是一种集中检索的方式,与Dialog联机检索中的跨联机检索中的跨文档检索文档检索 OneSearch非常类似。非常类似。优点:省时,不用就同一提问一次次地访问所选定的搜索引擎,每次均要优点:省时,不用就同一提问一次次地访问所选定的搜索引擎,每次均要输入同样的检索词等。且检索的是多个数据库,检索的综合性、输入同样的检索词等。且检索的是多个数据库,检索的综
18、合性、完整性也完整性也有所提高。有所提高。缺点:由于不同的搜索引擎的检索机制、算法及对提问式的解读均不同,缺点:由于不同的搜索引擎的检索机制、算法及对提问式的解读均不同,没有一个共同规范,使检索的准确性要相对差一些,并且速度也较慢。有没有一个共同规范,使检索的准确性要相对差一些,并且速度也较慢。有时多元搜索引擎检索出的结果可能还不如单个搜索引擎检索出的结果多,时多元搜索引擎检索出的结果可能还不如单个搜索引擎检索出的结果多,或给出的检索结果描述可能也不够详细,使用户虽得到了更多的检索结果,或给出的检索结果描述可能也不够详细,使用户虽得到了更多的检索结果,却缺少做进一步判断、阅读的相关指导信息。为
19、此,有些检索人员提出避却缺少做进一步判断、阅读的相关指导信息。为此,有些检索人员提出避免使用多元搜索引擎。但仍有些检索专家建议,在查询一些较模糊的提问,免使用多元搜索引擎。但仍有些检索专家建议,在查询一些较模糊的提问,或就某一课题的网络资源进行快速调查或就某一课题的网络资源进行快速调查、摸底、综览时使用多元搜索引擎。摸底、综览时使用多元搜索引擎。较常用的多元搜索引擎有:较常用的多元搜索引擎有:Dogpile,Metacrawler,Inference Find,SavvySearch,Highway61等等。三、重要的网络检索工具三、重要的网络检索工具 目录型网络检索工具目录型网络检索工具Ya
20、hoo!(http:/wwwyahoocom)InfoSeek (http:/infoseekgocom)搜狐搜狐 (http:/wwwsohucomcn)新浪搜索新浪搜索 (http:/search sina cn)网易搜索网易搜索 (http:/www yeah net)Yahoo!Yahoo 是是“Yet Another Hierarchical Officious Oracle”的的缩缩写写。Yahoo!是是最最早早开开发发的的互互联联网网搜搜索索引引擎擎,是是Internet搜搜索索工工具具的的“元元老老”,也也是是目目前前WWW环环境境中中最最著著名名最最常常用用的的搜搜索索工工具
21、具。它它是是由由美美国斯坦福大学两位博士生开发的。国斯坦福大学两位博士生开发的。Yahoo!不不同同于于其其他他搜搜索索工工具具在在于于它它提提供供了了全全面面的的分分类类体体系系。它它提提供供14个个宽宽泛泛的的类类目目,用用户户可可以以利利用用它它的的引引擎擎以以关关键键词词检检索索方方式式查查询询它它的的目目录录。Yahoo!目目录录的的最最大大特特点点在在于于信信息息的的分分类类工工作作由由十十几几位位专专家家手手工工进进行行,与与其其他他由由计计算算机机自自动动分分类类的的搜搜索索引引擎擎相相比比,Yahoo!的目录更具科学性。的目录更具科学性。Yahoo!提供分类查询方式。提供分类
22、查询方式。Yahoo!也也提提供供主主题题查查询询方方式式。通通过过简简单单关关键键词词或或关关键键词词高高级级检检索索方式进行信息查询。方式进行信息查询。Yahoo!提供强大的全球信息查询功能提供强大的全球信息查询功能,目前已有法国、意大利、,目前已有法国、意大利、挪威、瑞典、加拿大、澳大利亚、日本等挪威、瑞典、加拿大、澳大利亚、日本等13个国际站点。个国际站点。InfoSeek编制者:编制者:Infoseek属于属于Infoseek Corporation 公司,创立者是公司,创立者是Steve Kirsch,1995年提供服务。曾在年提供服务。曾在PC Computing中,被评比为最佳
23、的搜中,被评比为最佳的搜索服务节点。索服务节点。服务范围与规模:服务范围与规模:其提供的搜索服务除其提供的搜索服务除WWW节点搜索外,还有节点搜索外,还有Gopher、FTP、Usenet Newsgroup的文章查询,并且提供与电脑相关的文章查询,并且提供与电脑相关的报纸、杂志、电传新闻(的报纸、杂志、电传新闻(news wires)、工商信息、电影)、工商信息、电影/书籍书籍/录影录影带评论等全文搜索。带评论等全文搜索。检索性能:检索性能:管道检索,这是管道检索,这是Infoseek的独特功能,即用管道符()连的独特功能,即用管道符()连接两个或更多的检索词。接两个或更多的检索词。Info
24、seek有一套自定义的标识符,例如词组有一套自定义的标识符,例如词组检索要求把词组用检索要求把词组用“”括起来;对所要搜索的关键词加方括号括起来;对所要搜索的关键词加方括号 ,表示,表示方括号内的词在文字中出现时,其间隔不超过方括号内的词在文字中出现时,其间隔不超过100个词。个词。“+”放在单词前放在单词前表示该词出现在检索结果中。表示该词出现在检索结果中。评价:评价:Infoseek庞大的全文数据库保证了它的查全率,而它独特的检索庞大的全文数据库保证了它的查全率,而它独特的检索算法和检索功能,又提高了它的查准率,同时由于其丰富的服务内容,算法和检索功能,又提高了它的查准率,同时由于其丰富的
25、服务内容,使得使得Infoseek由一个检索工具变为一个强大的信息服务中心。由一个检索工具变为一个强大的信息服务中心。Infoseek曾被曾被PC Week杂志称为最全面的检索工具杂志称为最全面的检索工具搜狐搜狐原名原名http/搜狐是由爱特信公司搜狐是由爱特信公司1998年年开始研制的。搜狐是针对国际互联网上中文信开始研制的。搜狐是针对国际互联网上中文信息日渐丰富、查找困难的实际情况,根据中国人的文化传统专门为中国用息日渐丰富、查找困难的实际情况,根据中国人的文化传统专门为中国用户度身设计推出的网络分类式查找引擎。曾被路透社誉为户度身设计推出的网络分类式查找引擎。曾被路透社誉为“the mo
26、st popular website destination in China”。搜狐的全面战略及内容合作伙伴有英特尔搜狐的全面战略及内容合作伙伴有英特尔(Intel),道,道琼斯(琼斯(Dow Jones),热连线热连线(Hot Wired),时代华纳,时代华纳,NBA和新华社等。和新华社等。搜狐提供了一个分类详尽的搜狐提供了一个分类详尽的Web目录,采用树型结构对站点进行层次性分目录,采用树型结构对站点进行层次性分类,根据相应的网页内容,将所有的网页分为地区类、工商经济类、计算类,根据相应的网页内容,将所有的网页分为地区类、工商经济类、计算机与互联网、教育等机与互联网、教育等18个类别,在
27、个类别,在18个大类下面又分成几百个小类。在关个大类下面又分成几百个小类。在关键词检索方面,搜狐自动在全部网页目录中利用全文检索的办法找到相关键词检索方面,搜狐自动在全部网页目录中利用全文检索的办法找到相关网页。网页。新浪搜索新浪搜索新浪搜索引擎是面向全球华人的网上资源查询系统,新浪搜索引擎是面向全球华人的网上资源查询系统,提供网站、中文网页、英文网页、新闻、软件、游戏提供网站、中文网页、英文网页、新闻、软件、游戏等查询服务。是互联网上最大规模的中文搜索引擎之等查询服务。是互联网上最大规模的中文搜索引擎之一。一。新浪搜索具有新浪搜索具有URL自动检测功能,并提供个性化服务自动检测功能,并提供个
28、性化服务给经常使用新浪搜索的用户:所见即所得给经常使用新浪搜索的用户:所见即所得我的书我的书签、桌面上搜索引擎签、桌面上搜索引擎新浪点点通两种服务。新浪点点通两种服务。新浪搜索提供新浪搜索提供“分类检索分类检索”和和“关键词查询关键词查询”两种查找方两种查找方式式。网易搜索网易搜索网易搜索不仅能够全文搜索超过网易搜索不仅能够全文搜索超过2400万个中文页面,万个中文页面,还可以搜索还可以搜索10亿个以上的亿个以上的Web文件。根据互联网本身文件。根据互联网本身的链接结构对相关网站用自动方法进行分类,提供开的链接结构对相关网站用自动方法进行分类,提供开放式信息目录,分放式信息目录,分18个类目,
29、然后再有若干子类。个类目,然后再有若干子类。在网易查询时不需要使用在网易查询时不需要使用“AND”,因为网易搜索引擎,因为网易搜索引擎会在关键词之间自动添加会在关键词之间自动添加“AND”。网易搜索引擎将返回四个不同方面的结果:相关目录、网易搜索引擎将返回四个不同方面的结果:相关目录、相关网站、相关网页和相关新闻。相关网站、相关网页和相关新闻。搜索引擎搜索引擎Google(http:/)AltaVista (http:/wwwaltavistacom)Lycos(http:/www1ycoscom)百度(百度(http:/)天网搜索天网搜索 (http:/epkueducn)GoogleGoo
30、gle成立于成立于1998年年 Google 创始人之一创始人之一 Larry Page 指出:指出:“完美完美的搜索引擎需要做到确解用户之意,切返用的搜索引擎需要做到确解用户之意,切返用户之需户之需”。“永不满足,力求最佳永不满足,力求最佳”是是google 矢志不移的价值观。矢志不移的价值观。搜索功能:搜索功能:Google提供网页搜索、新闻搜索、提供网页搜索、新闻搜索、图片搜索、本地搜索、大学搜索、学术搜索、图片搜索、本地搜索、大学搜索、学术搜索、实验室搜索等搜索功能。实验室搜索等搜索功能。AltaVistaAltaVista是是Digital Equipment公司开发的专为查询公司开
31、发的专为查询WWW网址和网址和Newsgroup全文检索的搜索引擎。该引擎主要是全文检索的搜索引擎。该引擎主要是Digital研究实验室于研究实验室于1995年夏天在年夏天在Palo Alto市所开发的研究计划成果,是目前市所开发的研究计划成果,是目前Internet上最优上最优秀的搜索工具之一。秀的搜索工具之一。特点:特点:(1)检索速度快。)检索速度快。AltaVista的检索速度非常快,一般只需数秒种。的检索速度非常快,一般只需数秒种。(2)检索内容新。它维护了一个含时间变量的数据库,能保证查)检索内容新。它维护了一个含时间变量的数据库,能保证查 询的资料是最新的。询的资料是最新的。(3
32、)检索内容全。通过)检索内容全。通过AltaVista可以访问可以访问1亿个网站;亿个网站;AltaVista以全文数以全文数据库为基础,用户可以获得它所标引网页的全部内容;除全文检索外,据库为基础,用户可以获得它所标引网页的全部内容;除全文检索外,AltaVista还支持对声音、图像的检索。还支持对声音、图像的检索。(4)检索功能全面,查全率、查准率高。)检索功能全面,查全率、查准率高。AltaVista的检索分简单检索和高的检索分简单检索和高级检索,其高级检索包含了全部布尔逻辑检索和自动截词检索功能。级检索,其高级检索包含了全部布尔逻辑检索和自动截词检索功能。LycosLycos是是卡卡耐
33、耐基基梅梅隆隆大大学学(Carnegie Mellon University)的的著著名名搜搜索索工工具具。于于1994年年8月月投投入入运运行行,在在当当前前众众多多的的搜搜索站中,是唯一一个号称可以索引索站中,是唯一一个号称可以索引91%的的WWW节点。节点。Lycos所所提提供供的的搜搜索索服服务务主主要要包包含含:WWW网网页页搜搜索索、Gopher以以及及FTP的的文文件件搜搜索索等等,曾曾被被PC World”评评比比为为前前11名名搜搜索索引引擎擎中中,信信息息品品质质与与搜搜索索结结果果关关连连性性最最好好的的一一个个搜搜索索工工具具,在在“l00Hot节节点点(http:/W
34、WW。100hotcom)中,同样排行在前中,同样排行在前11名之内的热门节点之一。名之内的热门节点之一。Lyeos提提供供的的信信息息资资源源服服务务中中有有几几种种:WWWWWW网网页页搜搜索索;地地图查询图查询(Road Map)(Road Map);Top 5Top 5Web SitesWeb Sites;City GuideCity Guide百度百度“百度百度”公司于公司于1999年底成立于美国硅谷,是目前全球最优秀年底成立于美国硅谷,是目前全球最优秀的中文信息检索与传递技术供应商。它的创建者是李彦宏和的中文信息检索与传递技术供应商。它的创建者是李彦宏和徐勇。徐勇。“百度百度”是全
35、球最优秀的中文信息检索与传递技术供应商之一,是全球最优秀的中文信息检索与传递技术供应商之一,公司号称公司号称“全球最大的中文搜索技术提供商全球最大的中文搜索技术提供商”。中国所有提供。中国所有提供搜索引擎的门户网站中,超过搜索引擎的门户网站中,超过90%以上都由以上都由“百度百度”提供搜索提供搜索引擎技术支持,现有客户包括新浪、搜狐、引擎技术支持,现有客户包括新浪、搜狐、Tom、腾讯、腾讯、263、21cn、上海热线、广州视窗、新华网、北方时空、西、上海热线、广州视窗、新华网、北方时空、西部时空、重庆热线、吉林信息港、大庆信息港、东方热线、部时空、重庆热线、吉林信息港、大庆信息港、东方热线、湖
36、南信息港、南阳信息港、顺德信息网。湖南信息港、南阳信息港、顺德信息网。百度搜索引擎拥有目前世界上最大的中文搜索引擎百度搜索引擎拥有目前世界上最大的中文搜索引擎,总量超,总量超过过3.5亿页以上,并且还在保持快速的增长。百度搜索引擎具亿页以上,并且还在保持快速的增长。百度搜索引擎具有高准确性、高查全率、更新快以及服务稳定的特点,能够有高准确性、高查全率、更新快以及服务稳定的特点,能够帮助广大网民快速地在浩如烟海的互联网信息中找到自己需帮助广大网民快速地在浩如烟海的互联网信息中找到自己需要的信息,因此深受网民的喜爱。要的信息,因此深受网民的喜爱。百度文化:百度文化:用户导向:坚持以用户需求为导向用
37、户导向:坚持以用户需求为导向 分享:不断学习总结并积极分享分享:不断学习总结并积极分享求实:坚持坦诚和实事求是的作风求实:坚持坦诚和实事求是的作风系统:从系统的角度思考解决问题系统:从系统的角度思考解决问题卓越:拥抱挑战和变化,追求卓越卓越:拥抱挑战和变化,追求卓越惜时:珍惜并善于管理时间惜时:珍惜并善于管理时间百度的使命:百度的使命:让人们最便捷地获取信息,找到所求。让人们最便捷地获取信息,找到所求。百度广告:百度广告:天网搜索天网搜索天网中英文搜索引擎是由北京大学计算机网络研究室天网中英文搜索引擎是由北京大学计算机网络研究室设计开发的,设计开发的,1997年年10月月29日正式在日正式在C
38、ERNET上向广上向广大大Internet用户提供用户提供Web信息导航服务,主要检索中国信息导航服务,主要检索中国教育和科研网上的教育和科研网上的Web资源。资源。天网中英文搜索引擎提供天网中英文搜索引擎提供WWW网页搜索和网页搜索和FTP检索。检索。该系统主要提供的是针对内容的检索,目前还不支持该系统主要提供的是针对内容的检索,目前还不支持对对URL名检索。名检索。天网提供简单查询和复杂查询两种方式,用户可选择天网提供简单查询和复杂查询两种方式,用户可选择查询匹配程度查询匹配程度(精确匹配、模糊匹配精确匹配、模糊匹配)、查询范围、查询范围(Web、Newsgroup)和显示模式和显示模式(标准、简要标准、简要)