《信息资源检索及利用课程重点.doc》由会员分享,可在线阅读,更多相关《信息资源检索及利用课程重点.doc(6页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、. .?信息资源检索与利用?课程要点1信息资源信息是普遍存在的,但并非所有的信息都是信息资源,信息只有经过人类加工后,可被利用的信息才能称为信息资源。2信息资源的分类按信息资源的存在状态可将其分为潜在的信息资源和现实的信息资源两大类。其中现实的信息资源依据其载体可分为体载信息资源、文献信息资源、实物信息资源和网络信息资源。 1体载信息资源体载信息资源指以人体为载体并能为他人识别的信息资源,按其表达方式又可分为口语信息资源和体语信息资源。口语信息资源是人类以口头语言表达出来但未被记录下来的信息资源,如谈话、授课、讲演、讨论等;体语信息资源是以人的体态表达出来的信息资源,如表情、手势、姿态、舞蹈等
2、。 2文献信息资源:文献信息资源是以文献为载体的信息资源。A按信息资源出版类型划分10大信息源科技图书;科技期刊;科技报告;会议文献;专利文献;学位论文;标准文献;政府出版物;产品样本;技术档案B按加工层次划分一次信息资源。一次信息的载体形式称为一次信息资源,也称原始文献。它是以作者本人的科研工作成果为依据而创作的原始文献,如期刊论文、科技报告、会议论文、专利文献、学位论文等,它具有新颖性、创造性和系统性等特征,参考和使用的价值较高。个人专著某某著书,而某某编的书不是一次文献而是二次或三次文献。二次信息资源。浓缩二次信息的载体形式称为二次信息资源,是查找一次信息资源的工具。它是将分散的、无序的
3、一次信息资源进展加工整理,使之成为系统有序的信息资源。二次信息资源具有浓缩性、聚集性、有序性等特点,它的作用不仅在于报道信息的内容,更重要的是可以提供原一次信息资源的线索。 例如:书目(marc数据)、题录、文摘、索引等。 图书馆检索室三次信息资源。三次信息的载体形式称为三次信息资源,它是指对一次信息资源进展综合分析、研究和评述而编写出来的成果。如手册、百科全书、年鉴以及其他综述和评论性文章等。三次信息资源源于一次信息资源,又高于一次信息,是一种再创性文献。 它可分为两大类:一类是综述、述评等,如各种综述、动态、进展报告;另一类是参考性工具书,如百科全书、年鉴、手册、词典、文献指南等零次信息资
4、源。零次信息的载体形式称为零次信息资源。它是指未经正式的最原始的记录,如书信、手稿、笔记、实验记录等。其主要特点是内容新颖,具有原始性,但不成熟,分散,难于检索。 如书信、手稿、笔记、记录等。也有人认为是科技人员口头交谈及直接作用于人的感觉器官的非文献知识,如操作技能、诊疗经历等。也可以说,零次文献是以文献所有者本身为载体的未公布于世的科技知识。以上四级信息资源的关系是,零次信息资源是一次信息资源的素材;一次信息资源是二次、三次信息资源的来源和根底;二次、三次信息资源是对一次信息资源进展组织、加工、综合后形成的,它们编写的目的明确,专指性强。3实物信息资源实物信息资源是指以实物为载体的信息资源
5、。4网络信息资源网络信息资源是指从计算机、通信技术、多媒体技术相互融合而形成的网络上可查找到的资源。网上可利用的信息资源是多种多样的,从网络信息管理和利用的角度出发,人们对已存在于网络中的信息资源进展了类型化和系统化研究,不同的角度有不同的分类形式,一般有以下几种: 按信息表现形式分有电子出版物和非电子出版物信息资源。 按信息的媒体形式分本为文本信息资源、超文本信息资源、多媒体信息资源和超媒体信息资源。 按网络信息资源加工层次,可以分为网络资源指南和搜索引擎,联机馆藏目录、数据库信息资源、电子出版物、网上参考工具和其它动态信息。 按照用户采用的不同的网络协议来划分,可以分为基于超文本传输协议H
6、TTP的信息资源、基于文件传输协议FTP的信息资源、基于远程登录TELNET的信息资源、新闻组Usenet/Newsgroups资源和电子信息资源。此外随着web2.0的开展信息资源也便及整个web2.0中,如博客,百科,维基,播客等等。3.信息资源检索信息资源检索是从信息资源集合中找出所需信息内容的过程。从广义上讲,信息资源检索包括两个过程,一是信息资源的存储Information Storage,所谓存储是对有关信息进展选择,并对信息特征进展著录、标引和组织,建立信息数据库的过程;二是信息资源的检索Information Retrieval,所谓检索是根据检索提问制定检索策略,利用信息数据
7、库查找信息资源的过程。从狭义上讲,信息资源检索仅指后一局部。 4.信息资源检索的分类1按信息资源检索结果的内容划分信息检索。信息检索按照其信息系统、内容及结果可分为以下两种类型: 信息线索检索。利用书目、文摘和书目型数据库等检索系统,检索的结果只是提供了信息线索。 信息的全文检索。这种检索以查找到信息全文为目的,检索的结果是找到全文信息。 数据检索。数据检索是指从检索系统存储的数据中查出用户所需数据的检索,如科技数据、金融数据、人口统计数据等。 事实检索。事实检索是指对特定的事件或事实的检索,包括事物的性质、定义、原理及发生的地点、时间、前因后果等。 2按信息资源检索技术划分全文文本检索。全文
8、文本检索也称全文数据库检索,它通过计算机将文件的全貌,包括文字、图形和图像等信息转换成计算机可读形式,直接采用自然语言来设置检索入口,检索时以文中任意信息单元作为检索点,计算机自动进展高速比照,完成检索过程。 多媒体检索。多媒体检索是指能够支持两种以上媒体的数据库检索。超文本检索。超文本检索是指超文本hypertext的内容排列是非线性的,它按知识信息单元及其关系建立起知识构造网络,如具有图形的信息又称超媒体hypermedia,超文本媒体的检索是通过超文本媒体hyperlink来实现的。 网络信息资源检索。网络信息资源检索是一种集合各种新型检索技术于一体,能够对各种类型、各种媒体的信息进展跨
9、时间、跨地理检索的大系统。5.信息资源检索系统 检索系统是用于报道、存储与查找信息的工具。检索系统的实质是将描述特定用户所需信息的提问特征与信息存储的检索标识进展异同比拟,从中找出与提问特征一致或根本一致的信息。检索系统应包括以下两个主要的方面: 1信息标引和存储过程。对大量无序的信息资源进展标引处理,使之有序化,并按科学的方法存储,组成检索工具或检索文档,即组织检索系统的过程。 2信息的需求分析和检索过程。分析用户的信息需求,利用已组织好的检索系统所提供的方法与途径检索有关信息,即检索系统的应用过程。 6.数据库及数据库类型1数据库的定义。根据 ISO/DIS 5127 号标准,数据库Dat
10、abase的定义为:至少由一种文档组成,并能满足某一特定目的或某一特定数据处理系统需要的一种数据集合。 2数据库类型。按照国际上通用的分类方法,数据库通常可划分为以下几个类型: 参考数据库Reference Database。参考数据库是指用户在这些数据库中获取信息线索后,还需要进一步查找原文或其他资料的一类数据库。它包括书目数据库和指南数据库。书目数据库Bibliographic Database:它是存储某个学科领域二次信息资源的数据库,其显著特征是向用户提供信息线索,只能检索出信息的标题、出处、著者、主题等。例如,?EI Village 2?、?美国化学文摘数据库?、?中文科技期刊篇名数
11、据库?等。指南数据库Directory Database:它是存储能够提供用户参考、给予用户指南的各类信息,如商业、企业等机构的名称、地址、,人物,出版物,工程,程序,活动等简要描述性信息的一类数据库,亦称指示性数据库。例如,公司名录数据库、人物传记数据库、技术标准数据库等均属此类。 源数据库Source Database。此类数据库在欧洲也称数据银行Data Bank。它是能够直接为用户提供原始资料或具体数据的一类数据库。7.信息资源的检索方法直接检索:指通过直接浏览或阅读原始文献获取所需信息的方法。通过它可以直接查找一次信息资源和三次信息资源。间接检索:指借助检索工具或检索系统查得文献线索
12、再获取原始文献的方法称为间接检索。它是文献检索常用的检索方法。8.检索策略广义地说,检索策略Retrieval Strategy是为实现检索目标而制定的全盘方案或方案,包括课题分析、检索系统选择、确定检索词及其相互间的逻辑关系、检索式的制定、调整检索方案等。狭义地说,检索策略是指填写的“检索提问单。在计算机检索中,策略问题是明确提出来的,必须慎重考虑的,因为它可能要完成的是一个比拟复杂、精细的检索课题,又是在人与机器的交互、对话中实现的。手检的策略考虑较少,因为比拟简单,方案研究的余地不多。9.课题检索步骤分析研究课题明确检索目的和要求选择检索工具和检索方法选择检索途径和检索标志查找文献线索整
13、理检索结果索取原文。1课题分析分析检索课题的目的是使用户搞清楚其课题要解决的实质问题,即它所包含的概念和具体要求以及它们之间的关系。这是制定检索策略的根本出发点,也是检索效率上下或成败的关键。课题分析需要明确以下具体问题:研究课题的主题、课题所涉及的学科X围、课题所需信息内容及其内容特征。课题所需信息的类型,包括文献信息载体、出版类型、所需文献量、年代X围、涉及的语种、有关著者、机构等。课题对查新、查准、查全的指标要求。2检索系统或检索工具的选择一个计算机检索系统通常可以提供多个可检索数据库,一个手工检索系统就是一种检索工具。选择检索工具和检索系统时,要考虑的主要问题是:从内容上和时间上,考虑
14、检索工具和数据库对课题的覆盖和一致性,比方应综合考虑选择专业性强、收录X围广、检索途径多、编制质量高、使用方便的检索工具或数据库。在手段和技术上,有机检条件的一般就不选择手检工具,机检无疑有较高的效率。考虑价格和可获得性,选择手头容易获得的检索系统,注意数据库的价格,权衡价格效益比。3检索途径不同的检索入口,有相应的检索路径(approach),称作检索途径。手检工具只提供比拟常用的检索途径,如分类途径、主题途径、著者途径、途径、引文途径等;在计算机检索系统中,检索点很多,几乎文献的每一个特征都可作为检索点,并且可以实现全文检索。4检索式的制定依据检索词之间的逻辑关系,用检索系统识别的符号将检
15、索词连接起来,反映研究内容、表达研究者意图的式子。在手检系统中,每次检索只能从一个检索点出发,而且只能选择其中的一个属性值,比方主题检索,只能从某个概念出发,检索X围比拟宽。机检时利用检索式各种途径结合可以有效地控制检索X围。5原文索取 用户无论是利用手工检索系统还是计算机检索系统,信息资源检索的目的都是找到适合的信息资源。这是检索过程的终结,也是进展信息资源检索的最终目的。原文获取主要有以下几种方法先电子后印刷,数字化出版特一般更新快、出版快,查询输出非常方便。先近后远,可以先查所在图书馆的馆藏,如果没有,可以利用联合目录数据库,查看附近的图书馆或其它信息机构是否有收藏。利用馆际互借及原文传
16、递效劳,许多图书馆设有此项效劳,难以获取的外文文献可以向国外的图书馆和文献提供机构求助。馆际互借ILLInter Library Loan是指馆与馆间的图书资料借阅合作,是图书馆开放效劳Open Service的一个重要方面。原始的方法是靠人去其他合作馆借复原件或取回复印件,这可由个人也可委托图书馆效劳部门来完成。文献传递DDDocument Delivery是指利用各种通信手段、从各种文献效劳中心获取文献信息的有效手段。其效劳模式多样,比方:邮递Mail、快递Express Mail、电传Telex、 Fax及电子等。文献传递的电子化、网络化使传送的信息量更大,内容更丰富,使传送的速度更快捷
17、,手续更简单,使用户获得文献信息的渠道更畅通。网络环境下的资源共享目前基于互联网进展的全文效劳大致可以分为两种类型:全文效劳和原文传递效劳。全文效劳Link to Full Text。用户在数据库中找到一篇适用的文献,系统在界面上提供了一个全文按钮,帮助用户直接到其他数据库或其他系统中的原文文献,称为全文效劳。这种是通过系统与系统之间的协议或接口、数据库和数据库之间内容的整合实现的,是直接到具体文献Title to Title,而不是超Hyperlink,后者仅仅到期刊刊名或数据库一层,用户还必须再次检索。原文传递效劳Document Delievrey。即二次文献数据库具备网上检索和发送原文
18、传递请求的功能,用户检索到所需文献后,单击“原文传递按钮,将索要全文的请求直接发送给数据库提供商,提供商或提供商委托的文献提供单位为用户提供原文传递效劳。目前有这项效劳的国内数据库主要有:CALIS联合目录数据库和国家科技图书文献中心外文期刊目次库。10.检索方式(1)浏览检索 浏览检索,它是人工检索语言的应用与延伸,即由系统提供一个树状构造的概念等级体系,用户可以沿着这颗“树进入不同的分支,到达叶子节点,并在节点看到检索结果列表。它的作用就是为用户提供一个知识体系,让用户可以俯瞰全貌,了解某一个方面的信息总体情况。如主题浏览、分类浏览、文献类型浏览、学科导航等等。(2)简单检索简单检索又称为
19、根本检索、快速检索,即为用户提供一个简单的检索界面,帮助非专业事初入门用户方便地提交检索式。页面上通常只有一个检索框,用户提交检索式后,系统将提问发送到默认的一个或几个标引字段中进展匹配运算,检索出结果。(3)高级检索高级检索也称复杂检索、指南检索、专家检索,它是为专业用户、资深用户提供的比拟复杂的检索界面,可以构建比拟细致的检索式,帮助用户进展准确检索。命令检索就属于高级检索的一种。命令检索通常用于联机检索系统,通过命令方式实施检索。检索式由假设干检索词组配形成。这些检索词的扩展、限定的字段,它们之间的逻辑关系、位置关系等均可由算符的连接来表示。尽管不同的联机系统由各自定义的算符表示,命令形
20、式不尽一样,但都有许多一致的检索功能。以下用国际上比拟成熟的美国 Dialog 联机检索系统的命令方式为例来讨论命令检索根底。(4)索引检索索引是一个线性的表单,可以将任何一个标引字段中的概念按字母顺序线性排列起来,不分等级。用户通过检索,可以定位在索引中的任意某个位置,并浏览在这个位置附近的所有词语,进而查询所需词语对应的结果列表。索引的种类很多,如人名索引、出版物索相、地名索引、主题索引、机构索引等等。(5)超文本检索超文本检索是指超文本hypertext的内容排列是非线性的,它按知识信息单元及其关系建立起知识构造网络,如具有图形的信息又称超媒体hypermedia,超文本媒体的检索是通过
21、超文本媒体hyperlink来实现的。 11.评价指标检索效果Retrieval Effectiveness是指信息资源检索系统检索信息资源的有效程度,反映信息资源检索系统的能力。克兰弗登Cranfield在分析用户根本要求的根底上,提出了 6 项评价系统性能的指标,包括收录X围、查全率、查准率、响应时间、用户负担及输出形式。1查全率(recall ratio)指检出文献中符合需要的文献数量占数据库中存在的符合该需要的所有文献的比例。用字母R表示。R=检出的相关文献量 / 检索系统中相关文献量2查准率(precision ratio)指检出文献中符合需要的文献数量占检出文献全部数量的比例。用字
22、母P表示。P=检出的相关文献量 / 检出的文献总量一系列的试验结果说明,查全率和查准率之间存在互逆关系,如果对检索系统要求较高的查全率,那么查准率必然下降,反之亦然。12.检索匹配方式1准确匹配:输入的检索词与检索结果完全一致,如检索词“ABC,检索结果也为:“ABC2前项匹配:输入的检索词在检索结果的最前面,其余局部没有限制。如检索词“ABC,检索结果为:“ABC3后项匹配:输入的检索词在检索结果的最后面,其余局部没有限制。如检索词“ABC,检索结果为:“ABC4模糊匹配:输入的检索词在检索结果的任意局部。如检索词“ABC,检索结果可以为“ABC、“ABC、“ABC或者“ABC13.参考数据
23、库 参考数据库reference database是指包含各种数据、信息或知识的原始来源和属性的数据库。数据库中的记录是通过对数据、信息或知识的再加工和过滤,如编目、索引、摘要、分类等,然后形成的。一般说来,参考数据库主要是针对印刷型出版物而开发的。 参考数据库主要包括:书目数据库、文摘数据库、索引数据库。书目数据库主要是针对图书进展内容及存储地址的报道与提示,如各图书馆馆的馆藏目录;文摘和索引数据库那么相对期刊论文、会议论文、专利文献、学位论文等进展内容和属性的认识与加工,它提供确定的文献来源信息,供人们查阅和检索,但一般不提供原始文献的馆藏信息。14四大检索工具:美国?工程索引?the E
24、ngineering Index,EI。美国?科学引文索引?Science Citation Index,SCI。 美国?科技会议录索引?Index to Scientific & Technical Proceedings,简称ISTP。美国?科学评论索引?ISR-Index to Scientific Reviews国家科技部下属的“中国科学技术信息研究所从 1987 年起,每年以国外四大检索工具 SCI 、ISTP 、Ei、ISR 为数据源进展学术排行。由于 ISR(?科学评论索引?) 收录的论文与 SCI 有较多重复,且收录我国的论文偏少,因此1993年起不再把 ISR 作为论文的统计
25、源。而其中的 SCI(科学引文索引 )、EI(工程索引 )、ISTP(科技会议录索引 ) 就是我们常说的国外三大检索工具,是国际公认的进展科学统计与科学评价的主要检索工具,其中以SCI最为重要。15.外文参考数据库常见检索结果实例分清各局部的表示含义1EI (the Engineering Index)光盘版与网络版的区别,是否有主题标引和分类标引。EI详细记录中,各局部的含义。2SPE石油工程师协会Society of Petroleum Engineers会议论文SPE的具体应用,记录中各局部的含义。16常用搜索引擎检索技巧1检索指定格式的文档。“filetype:doc 检索词2检索在网页标题中含有检索词的网页。“intitle: 检索词3在google同义词的搜索。“检索词4在google定义的搜索。“define: 奥运会5搜索与该网页存在的网页。“link:.xsyu.edu.17了解图书馆借书的整个过程1检索选书记索取号和藏书地点到藏书地点找书到借阅台借书2检索时如果没有找到图书,可以通别网络检索别的学校的馆藏资源,然后利用馆际互借证或者通过该学校的朋友进展借阅,此外还可以考虑文献传递效劳。. .word.