《《网络信息资源检索》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《网络信息资源检索》PPT课件.ppt(23页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、 第一节第一节 数字信息资源检索概数字信息资源检索概念与类型念与类型数字信息资源概念数字信息资源概念 狭义地讲,可称电子资源,指一切以数字形式狭义地讲,可称电子资源,指一切以数字形式生产和发行的信息资源。所谓数字形式,是以能生产和发行的信息资源。所谓数字形式,是以能被计算机识别的,不同序列的被计算机识别的,不同序列的“0”“0”和和“1”“1”构成构成的形式。的形式。数字资源中的信息,包括文字,图片,声音,数字资源中的信息,包括文字,图片,声音,动态图像等,都是以数字代码方式存储在磁带,动态图像等,都是以数字代码方式存储在磁带,磁盘,光盘等介质上,通过计算机输出设备和网磁盘,光盘等介质上,通过
2、计算机输出设备和网络传送出去最终显示在用户的计算机终端上。络传送出去最终显示在用户的计算机终端上。数字信息资源的特点数字信息资源的特点qq存储介质和传播形式发生变化存储介质和传播形式发生变化 将文字,图像及各类音像资料中的声音动态图像结将文字,图像及各类音像资料中的声音动态图像结合在一起,利用数字技术进行制作存储在光盘,磁盘,合在一起,利用数字技术进行制作存储在光盘,磁盘,硬盘等载体上硬盘等载体上qq以多媒体作为内容特征以多媒体作为内容特征 集文本图片,动态图像,声音超外国投资等多种形集文本图片,动态图像,声音超外国投资等多种形式为一体式为一体qq信息资源类型多种多样信息资源类型多种多样 包括
3、数据库,电子期刊,电子图书,电子报纸,专包括数据库,电子期刊,电子图书,电子报纸,专利等正式出版物,以及学位论文,教学课件等灰色文利等正式出版物,以及学位论文,教学课件等灰色文献献qq多层次的信息服务功能多层次的信息服务功能 检索功能,学科导航,分类主题指南,网上讨论等检索功能,学科导航,分类主题指南,网上讨论等数字信息资源的特点数字信息资源的特点qq更新速度快,时效性强qq具备检索系统qq不受时间,地域限制。数字信息资源的产生与发展数字信息资源的产生与发展qq19601960年代初,年代初,“化学题录化学题录”和和“医学索引医学索引”qq19651965年以后,数据库联机检索开始出现,最著年
4、以后,数据库联机检索开始出现,最著名的如名的如DIALOGDIALOG,MEDLINEMEDLINE等,等,qq19801980年以后,由于卫生通信技术,光纤通信技年以后,由于卫生通信技术,光纤通信技术,个人计算机的产生和发展,数据库数量已术,个人计算机的产生和发展,数据库数量已达到达到36003600个。数据库的类型也由书目,文摘,个。数据库的类型也由书目,文摘,索引数据库发展为全文数据库及数值,指南数索引数据库发展为全文数据库及数值,指南数据库据库qq2020世纪世纪9090年代以后,网络和信息处理技术的发年代以后,网络和信息处理技术的发展,使得基于互联网开发的数字资源及其检索展,使得基于
5、互联网开发的数字资源及其检索系统有了突飞猛进的增长系统有了突飞猛进的增长数字信息资源的类型数字信息资源的类型qq按照数字资源的性质和功能分按照数字资源的性质和功能分按照数字资源的性质和功能分按照数字资源的性质和功能分一次文献:一次文献:一次文献:一次文献:原始文献,指反映最原始思想,成果,过原始文献,指反映最原始思想,成果,过程以及以其进行分析,综合,总结的信息资源程以及以其进行分析,综合,总结的信息资源二次文献:二次文献:二次文献:二次文献:对一次文献进行加工,整理便于利用一次对一次文献进行加工,整理便于利用一次文献的信息资源,如网络资源学科导航,分类指南文献的信息资源,如网络资源学科导航,
6、分类指南等。二次文献可以把大量分散的一次文献按学科或等。二次文献可以把大量分散的一次文献按学科或主题集中起来组织成无数相关信息的集合。主题集中起来组织成无数相关信息的集合。三次文献:三次文献:三次文献:三次文献:指对二次文献进行综合分析,加工,整理指对二次文献进行综合分析,加工,整理的信息资源,如专门用于检索搜索引擎的搜索工具的信息资源,如专门用于检索搜索引擎的搜索工具按照数字资源的生产途径和发布范围划分按照数字资源的生产途径和发布范围划分qq商用电子资源:也称正式电子出版物qq网络公开学术资源:半正式出版物,包括各种学术团体,行业协会,政府机构,商业部门,教育机构等在网上正式发布的网页及其信
7、息qq特色资源:也属于半正式出版物,主要基于各教育机构,政府机关,图书馆的一些特色收藏制作。按照数字资源的载体划分按照数字资源的载体划分qq光盘数据库qq网络数据库qq联机数据库等按照数字资源的学科划分按照数字资源的学科划分 如农业,人类学,天文学,艺术,航空航天等主要信息资源类型主要信息资源类型参考数据库 全文数据库 事实数据库 搜索引擎/分类指南 网络学术资源学科导航 FTP资源 其他 主要信息资源类型主要信息资源类型 指包含各种数据、信息或知识的原始来源和属性的数据库。指包含各种数据、信息或知识的原始来源和属性的数据库。数据库中的记录是通过对数据、信息或知识的再加工和过滤,数据库中的记录
8、是通过对数据、信息或知识的再加工和过滤,如编目、索引、摘要、分类等,然后形成的。如编目、索引、摘要、分类等,然后形成的。参考数据库主要包括:参考数据库主要包括:书目数据库书目数据库书目数据库书目数据库:主要是针对图书进行内容的报道与揭示的,如各图书馆的馆主要是针对图书进行内容的报道与揭示的,如各图书馆的馆藏机读目录数据库;藏机读目录数据库;文摘和索引数据库文摘和索引数据库文摘和索引数据库文摘和索引数据库:对期刊论文、会议论文、专利文献、学位论文等进行内容对期刊论文、会议论文、专利文献、学位论文等进行内容和属性的认识与加工,如和属性的认识与加工,如“科学引文索引科学引文索引”(Science S
9、cience Citation IndexCitation Index)、)、“化学文摘化学文摘“(Chemical AbstractsChemical Abstracts)、)、“工程索引工程索引”(Engineering IndexEngineering Index)等数据库。)等数据库。1.参考数据库:参考数据库:参考数据库:参考数据库:2.3.4.5.6.6.主要信息资源类型主要信息资源类型2 2 全文数据库全文数据库 收录有原始文献全文的数据库,以期刊论文、会收录有原始文献全文的数据库,以期刊论文、会议论文、政府出版物、研究报告、法律条文和议论文、政府出版物、研究报告、法律条文和案例
10、、商业信息等为主。案例、商业信息等为主。主要信息资源类型主要信息资源类型事实数据库事实数据库 指包含大量数据数据、事实,直接提供原始资料的指包含大量数据数据、事实,直接提供原始资料的数据库,又分为数值数据库、指南数据库、术语数数据库,又分为数值数据库、指南数据库、术语数据库等,相当于印刷型文献中的字典、辞典、手册据库等,相当于印刷型文献中的字典、辞典、手册等。等。数值数据库数值数据库:指专门以数值方式表示数据,如统计数据库,化学反应数指专门以数值方式表示数据,如统计数据库,化学反应数据库等;据库等;指南数据库指南数据库:如公司名录、产品目录等;如公司名录、产品目录等;术语数据库术语数据库:即专
11、门存储名词术语信息、词语信息等的数据库,如电即专门存储名词术语信息、词语信息等的数据库,如电子版百科全书、网络词典等。子版百科全书、网络词典等。主要信息资源类型主要信息资源类型搜索引擎搜索引擎/分类指南分类指南 搜索引擎搜索引擎搜索引擎搜索引擎主要是使用一种计算机自动搜索软件,在互联主要是使用一种计算机自动搜索软件,在互联网上检索,将检索到的网页编入数据库中,并进行一定程网上检索,将检索到的网页编入数据库中,并进行一定程度的自动标引,用户使用时输入检索词搜索引擎将其与数度的自动标引,用户使用时输入检索词搜索引擎将其与数据库中的信息匹配,然后产生检索结果。例如常用的据库中的信息匹配,然后产生检索
12、结果。例如常用的Yahoo,Hotbot,Alta Vista,Excite,Google,Yahoo,Hotbot,Alta Vista,Excite,Google,天网,悠游等天网,悠游等 分类指南分类指南分类指南分类指南是将搜索到的网页按主题内容组织成等级结构是将搜索到的网页按主题内容组织成等级结构(主题树),用户按照这个目录逐层深入,直到找到所需(主题树),用户按照这个目录逐层深入,直到找到所需文献。通常搜索引擎与分类指南是结合在一起的,例如:文献。通常搜索引擎与分类指南是结合在一起的,例如:YahooYahoo,新浪,悠游等。,新浪,悠游等。主要信息资源类型主要信息资源类型网络学术资
13、源学科导航网络学术资源学科导航 将互联网上的开放信息加以甄别、筛选和科学整理,将互联网上的开放信息加以甄别、筛选和科学整理,按学科组织起来构成完事的学科导航系统,为教学、按学科组织起来构成完事的学科导航系统,为教学、科研、技术人员提供各类学术信息。与搜索引擎科研、技术人员提供各类学术信息。与搜索引擎/分分类指南不同的是,网络学术资源的学科导航库通常类指南不同的是,网络学术资源的学科导航库通常是由图书馆单独或联合建设的。是由图书馆单独或联合建设的。主要信息资源类型主要信息资源类型FTP资源资源 FTPFTP含义是含义是File Transfer Protocol,File Transfer Pr
14、otocol,意为文件传送协议,意为文件传送协议,是互联网上最早应用的协议之一,它可以使用户远程登是互联网上最早应用的协议之一,它可以使用户远程登录到远端计算机上,把其中的文件传回到自己的计算机录到远端计算机上,把其中的文件传回到自己的计算机上,或把自己计算机上的文件传到远端计算机系统上。上,或把自己计算机上的文件传到远端计算机系统上。所谓所谓FTPFTP资源,是指互联网上的资源,是指互联网上的FTPFTP站点,这些站点站点,这些站点允许用户登录上去,从中下载各类数据、资料、软件等。允许用户登录上去,从中下载各类数据、资料、软件等。有些搜索引擎,如天网有些搜索引擎,如天网()(),可以专门用来
15、检索网上的,可以专门用来检索网上的FTPFTP站点。站点。其他:其他:如网站,如网站,BBSBBS,新闻组等,也可以给用户提供一,新闻组等,也可以给用户提供一些有用的知识或动态信息。些有用的知识或动态信息。第二节第二节 数字信息资源的检索数字信息资源的检索数字信息资源检索的概念数字信息资源检索的概念 是指通过检索系统,采用一定的技术手段,根是指通过检索系统,采用一定的技术手段,根据一定的准则,在数据库或其他形式的网络信息据一定的准则,在数据库或其他形式的网络信息资源中自动找出用户所需相关信息。简单地说,资源中自动找出用户所需相关信息。简单地说,是一个信息存取的过程,是人、计算机和网络共是一个信
16、息存取的过程,是人、计算机和网络共同作用下自动完成的。同作用下自动完成的。数字信息资源检索系统的构成数字信息资源检索系统的构成 从物理构成来讲,检索系统由从物理构成来讲,检索系统由硬件、软件、数据库硬件、软件、数据库三部分组成三部分组成 硬件:硬件:也可以说是硬件环境,是和计算机检索有关的各种也可以说是硬件环境,是和计算机检索有关的各种硬件设备的总称,如大型计算机主机,存储器,网络,输硬件设备的总称,如大型计算机主机,存储器,网络,输入输出设备,计算机终端或个人计算机。入输出设备,计算机终端或个人计算机。软件:软件:与计算机检索有关的数据库系统软件及相关应用软与计算机检索有关的数据库系统软件及
17、相关应用软件。包括:信息采集、存储、信息标引加工、建库、词表件。包括:信息采集、存储、信息标引加工、建库、词表管理、用户检索界面、提问处理、网络发布、数据库管理管理、用户检索界面、提问处理、网络发布、数据库管理等模块。等模块。数据库数据库:数据库是指按一定方式,以数字形式存储,:数据库是指按一定方式,以数字形式存储,可通过计算机存取、相互关联的数据库集合可通过计算机存取、相互关联的数据库集合 按照功能划分,又可以分为以下几个模块按照功能划分,又可以分为以下几个模块A A 信息采集模块信息采集模块:本模块的任务是连续、快速地采集各:本模块的任务是连续、快速地采集各类信息,为数据库提供充足的数据来
18、源。类信息,为数据库提供充足的数据来源。B B 信息存储模块:信息存储模块:对数字资源进行存储和管理,数字资源按照不对数字资源进行存储和管理,数字资源按照不同类型,如文字、声音、图像、数字等,按不同的格式被存储在同类型,如文字、声音、图像、数字等,按不同的格式被存储在不同的数据仓库中。不同的数据仓库中。C C 标引著录模块:标引著录模块:对信息的内容和特征进行分析,然后给予一定对信息的内容和特征进行分析,然后给予一定数量的标识,作为信息组织、存储与检索的基础。例如信息的数量的标识,作为信息组织、存储与检索的基础。例如信息的名称、创作者、主题、分类、出版名称、创作者、主题、分类、出版/生产时间、
19、出版生产时间、出版/生产者、生产者、关键词等,都可以作为信息的描述性标识。关键词等,都可以作为信息的描述性标识。D D 规范模块:规范模块:指对信息特征和用户提问的语言形式做出规定,指对信息特征和用户提问的语言形式做出规定,如主题词表、人名规范、地名规范、时代名称规范等。目的如主题词表、人名规范、地名规范、时代名称规范等。目的在于:一是使用户的检索更具准确性;二是逐步形成一个知在于:一是使用户的检索更具准确性;二是逐步形成一个知识网络,通过相关信息的提供,使用户的检索更为完整。识网络,通过相关信息的提供,使用户的检索更为完整。E.E.内容发布模块:内容发布模块:将数据库内容传递到网络上,让用户
20、以常规手将数据库内容传递到网络上,让用户以常规手段查询浏览。段查询浏览。F.F.检索模块:检索模块:即狭义的检索系统,即将用户的需求进行分析,即狭义的检索系统,即将用户的需求进行分析,并和数据库中的信息匹配运算,再反馈给用户所需的检索结果。并和数据库中的信息匹配运算,再反馈给用户所需的检索结果。G.G.服务模块:服务模块:这是在传统检索系统基础上发展起来的新功能,这是在传统检索系统基础上发展起来的新功能,即不仅向用户提供检索,也在信息资源基础上,根据用户需求,即不仅向用户提供检索,也在信息资源基础上,根据用户需求,为用户提供一些可定制的服务,以及由系统主动向用户提供新为用户提供一些可定制的服务
21、,以及由系统主动向用户提供新的服务内容。的服务内容。H.H.管理模块:管理模块:主要指管理客户端,即对用户和用户行为进行管理主要指管理客户端,即对用户和用户行为进行管理和调查分析。包括三个部分:一是对用户的管理;二是运用数学和调查分析。包括三个部分:一是对用户的管理;二是运用数学和统计学方法对用户行为的各种相关信息进行累积、加工、分析,和统计学方法对用户行为的各种相关信息进行累积、加工、分析,生成各种状态报告,提供给数据库生产者、系统开发者和用户,生成各种状态报告,提供给数据库生产者、系统开发者和用户,以便对数据库及其系统进行修改、完善,使其不断得到提高;三以便对数据库及其系统进行修改、完善,使其不断得到提高;三是监控系统使用情况,如观察用户有无违反版权规定、恶意下载是监控系统使用情况,如观察用户有无违反版权规定、恶意下载现象,并对违法用户进行相应处罚。现象,并对违法用户进行相应处罚。第三节第三节 常用检索途径常用检索途径题名题名 作者姓名作者姓名分类分类主题主题关键词检索关键词检索顺序号检索顺序号检索