《网络信息检索技术8上课ppt课件教案.ppt》由会员分享,可在线阅读,更多相关《网络信息检索技术8上课ppt课件教案.ppt(28页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、网络信息检索技术8上课ppt课件 Still waters run deep.流静水深流静水深,人静心深人静心深 Where there is life,there is hope。有生命必有希望。有生命必有希望途径之一:搜索引擎途径之一:搜索引擎第一代第一代:以网络、网页的数量:以网络、网页的数量 多少为标准,结果不按相多少为标准,结果不按相关性排序,代表为关性排序,代表为LycosLycos,LycosLycos是搜索引擎中的元老,是搜索引擎中的元老,是最早提供信息搜索服务的网站之一。是最早提供信息搜索服务的网站之一。第二代:第二代:以以检检索索结结果的果的质质量量为为目目标标,检检索思想
2、、方法索思想、方法发发生生转变转变,检检索索结结果排序并果排序并进进行超行超链链分析,代表分析,代表为为GoogleGoogle、Baidu Baidu。第三代第三代:未来:未来趋势趋势智能化搜索工具,智能化搜索工具,进进行概念分析。行概念分析。根根据检索提问,进行智能化分析与搜索,并对检索结果进据检索提问,进行智能化分析与搜索,并对检索结果进行分析、筛选、排序、链接和提示等。行分析、筛选、排序、链接和提示等。Google主页主页网络资源获取途径之二:网络资源获取途径之二:网网络络地址地址一个城市如果没有街道、一个城市如果没有街道、门门牌号,要找到一个地方很牌号,要找到一个地方很难难,网网络络
3、也如此。也如此。在国在国际际互互联联网上有成千百万台主机,网上有成千百万台主机,为为了区分它了区分它们们,给给每每台主机都分配了一个台主机都分配了一个专门专门的的“地址地址”作作为标识为标识,称,称为为IPIP地址。地址。每个每个IPIP地址的地址的长长度度为为3232位(位(bitbit),),每段数字范每段数字范围为围为1 1254Bit254Bit,段与段之,段与段之间间用小数点分隔。如用小数点分隔。如202.197.191.1202.197.191.1由于由于IPIP地址是数字型的,使用起来不方便,于是人地址是数字型的,使用起来不方便,于是人们们又又发发明了另一套字符型的地址方案,即域
4、名地址。入网的每台明了另一套字符型的地址方案,即域名地址。入网的每台主机都具有主机都具有类类似于下列似于下列结结构的域名:构的域名:如,如, 。在掌握网在掌握网络络地址的情况下,可以地址的情况下,可以利用地址利用地址栏进栏进行行检检索,直接、索,直接、简简便。便。商都商都信息港信息港域名域名网络资源获取途径之三:网络资源获取途径之三:主题指南(主题指南(Subject Subject DirectoryDirectory,网络目录,网络目录)(如搜弧如搜弧 雅虎雅虎Yahoo!Yahoo!)工作原理:将网络信息利用人工分类的方法组织成一个树工作原理:将网络信息利用人工分类的方法组织成一个树状目
5、录结构,用户根据主题类目和子类目逐层深入查找所状目录结构,用户根据主题类目和子类目逐层深入查找所需信息。需信息。优点:优点:搜集的信息经过人工筛选,质量较高,结果更具搜集的信息经过人工筛选,质量较高,结果更具有参考价值。有参考价值。缺陷:信息量小;类目不易确定;信息更新速度慢。缺陷:信息量小;类目不易确定;信息更新速度慢。例如:搜狐于例如:搜狐于19981998年推出中国首家大型分类形式的主题指年推出中国首家大型分类形式的主题指南。南。1818个部类、近个部类、近1010万条链接构成的树型网页结构万条链接构成的树型网页结构 。每。每日页面浏览量超过日页面浏览量超过800800万,可以查找网站、
6、网页、新闻、万,可以查找网站、网页、新闻、网址、软件、黄页等信息。网址、软件、黄页等信息。主题指南主题指南主题指南主题指南网络资源获取途径之四:网络资源获取途径之四:网网络导络导航航网网络导络导航就是通航就是通过过一定的技一定的技术术手段,手段,为为网站的网站的访问访问者提供者提供一定的途径,使其可以方便地一定的途径,使其可以方便地访问访问到所需的内容。到所需的内容。相当于相当于传统图书馆传统图书馆信息部信息部门门的目的目录录索引。索引。网网络导络导航有航有许许多多类类,重点学科,重点学科导导航是其中一航是其中一类类。如各高校。如各高校重点学科重点学科导导航,北大、清航,北大、清华华。学科学科
7、导航导航网络资源获取途径之五:网络资源获取途径之五:网网络络资源链接、超链接资源链接、超链接检索到某一信息资源,往往有许多相关链接、推荐连检索到某一信息资源,往往有许多相关链接、推荐连接、热点连接等,顺链而下,可以查找到许多相关有接、热点连接等,顺链而下,可以查找到许多相关有价值信息。价值信息。相关链接相关链接网络资源获取途径之六:网络资源获取途径之六:网络数据库网络数据库网络数据库(免费、购买使用)网络数据库(免费、购买使用)免免费资费资源:参考下面网站推荐的免源:参考下面网站推荐的免费资费资源源 http:/ CNKI、万万方方学学位位论论文文数数据据库库、EI EI、SCI SCI 等等
8、中中外文数据库。外文数据库。网络资源获取途径之七:其他方法与途径网络资源获取途径之七:其他方法与途径网络会议、专业博客网站。网络会议、专业博客网站。免费纯网络期刊网站,如神州学人免费纯网络期刊网站,如神州学人 (http:/ 国外电力常用网址名录中国工商网址黄页中国国外电力常用网址名录中国工商网址黄页中国医学网址、医学网址、“中国精彩网址中国精彩网址”、“企业网址大全企业网址大全”等或等或运用网页地址历史记录、收藏夹直接进入相关站点,可以运用网页地址历史记录、收藏夹直接进入相关站点,可以省去输入网址的时间。省去输入网址的时间。神州学人月刊简介(纯电子期刊)神州学人月刊简介(纯电子期刊)神州学人
9、杂志历经14年的发展,围绕着“加强对广大在外留学人员进行爱国主义教育,鼓励他们回国工作或以适当方式为国服务,为我国改革开放和社会主义现代化建设事业做贡献”的办刊宗旨,经过多年的探索,其主要内容框架已基本形成,即:走近中国了解祖国的窗口;留学视野联络感情的纽带;学人园地表达情思的园地;留学服务提供服务的媒体。网络信息检索中的一些常用基本概念网络信息检索中的一些常用基本概念初级检索初级检索初级检索初级检索是面向一般读者提供的检索方式。利用初级检索系统能进行快速方便查询,适用于不熟悉多条件组合查询的普通用户。它为用户提供了详细的导航内容,最大范围的选择空间。对于一些简单查询,建议使用该检索系统。该查
10、询的特点是方便快速,执行效率较高,但查询结果有很大的冗余,会检索出一大批检索者所不期望的结果。如果能在检索结果中进行二次检索或配合高级检索命中率会大大提高。简单检索界面简单检索界面网络信息检索中的一些常用基本概念网络信息检索中的一些常用基本概念高级检索高级检索高级检索包括布尔逻辑检索、位置检索、截词检索、限制检索等。利用高级检索系统能进行快速有效的组合查询,优点是查询结果冗余少,命中率高。缺点是必须掌握一定的检索技术。对于命中率要求较高的查询,建议使用该检索系统。高级检索界面高级检索界面检索入口检索入口网络信息检索中的一些常用基本概念网络信息检索中的一些常用基本概念检索入口检索入口检索入口检索
11、入口,又称检索途径(或可检字段),是用户作为检索依据的文献特征,包括文献的内容特征和外部特征。这些特征在数据库中以字段的形式表现,所以检索入口也称检索字段。全文数据库中常用的检索途径有:关键词、刊名、作者、题名、分类号、文摘、分类号、任意字段。读者可根据所掌握的文献特征情况及检索目的选择适当的检索入口。网络信息检索中的一些常用基本概念网络信息检索中的一些常用基本概念检索范围检索范围 为了提高检索效率和满足特定需求,用户检索时可以先设定检索范围。用户常设的检索范围有:学科范围、期刊范围、时间范围、语言范围、地域或国家范围等,在下一节的数据库检索中我们将具体介绍如何选择检索范围。网络信息检索中的一
12、些常用基本概念网络信息检索中的一些常用基本概念二次检索二次检索所谓二次检索二次检索就是在前次检索的基础上进行的再次检索,一般的二次检索的结果与第一次检索存在一定的关联性;通过二次检索可以缩小检索范围,优化检索结果。网络信息检索中的一些常用基本概念网络信息检索中的一些常用基本概念全文阅读全文阅读器器/浏览器浏览器全文阅读器全文阅读器是一种用于打开具有某些特定格式的全文的一种浏览软件。由于有些数据库的全文使用的是特定格式的文件,必须由相应的阅读器进行阅读,所以,在使用相应的数据库时,必须先下载相应的阅读器,才能阅读全文。如Acrobat Reader(阅读PDF格式文件)、CAJ、维普浏览器等。实验查询互联网上有哪些有声图书网站。查询互联网上有哪些有声图书网站。查阅有关查阅有关“基于小波神经网络的智能复合基于小波神经网络的智能复合材料损伤定位的仿真研究材料损伤定位的仿真研究”方面的中文文方面的中文文章。章。检索检索2009年税务与经济上发表的农村年税务与经济上发表的农村经济方面的文献经济方面的文献