计算机信息检索基本知识精选PPT.ppt

上传人:石*** 文档编号:49728445 上传时间:2022-10-10 格式:PPT 页数:73 大小:3.04MB
返回 下载 相关 举报
计算机信息检索基本知识精选PPT.ppt_第1页
第1页 / 共73页
计算机信息检索基本知识精选PPT.ppt_第2页
第2页 / 共73页
点击查看更多>>
资源描述

《计算机信息检索基本知识精选PPT.ppt》由会员分享,可在线阅读,更多相关《计算机信息检索基本知识精选PPT.ppt(73页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、计算机信息检索基本知识第1页,此课件共73页哦信息化社会生存策略 一、现代人应具备信息素质 信息素质包括两个方面:(1)信息意识 信息意识是指对知识信息重要性的认识和对知识信息的 敏感性。(2)信息能力 信息能力是指获取、加工、利用和创新知识信息的能 力,其重点和基础是信息检索能力。第2页,此课件共73页哦信息化社会生存策略二、现代人信息化生存策略 信息化生存包括数字化生存、网络化生存和智能化生存。数字化、网络化构成了人们生存的信息环境,而智能化是有效发挥知识信息的功能、解决问题、克服危机和创造财富的最佳方式。全球数字化信息近年来增长迅猛,据一项最新研究结果称,2006年全球产生的数字化信息总

2、量达1610亿吉比特,其中原创信息为400亿吉比特。而到2010年,全球产生的数字化信息总量有望达到9880亿吉比特。具有较高信息素质的人,就应表现出有良好的信息意识、敏捷的信息思维以及较强的信息能力。(1)培养良好的信息意识 (2)注重提高信息检索能力第3页,此课件共73页哦信息信息 知识知识 情报情报 文献文献信息是世界上一切事物的运动状态、特征及其反映。它与事物同在,与事物共存,不以人的意志而改变。信息是人类认识世界,改造世界的重要资源。了解和掌握各种信息的获取途径和方法,及时获得所需信息,对于个人、团体、企业、事业,乃至国家来说都至关重要。计算机信息检索基础知识第4页,此课件共73页哦

3、知识是人类对客观事物规律的认识。人类通过实践,认识和掌握自然和社会运动形态及其规律,同时对在实践中积累起来的经验进行概括、总结、升华,有选择地收入到人类的思维系统,形成知识。知识是信息的一部分,是人类认识和改造世界的武器。把信息转化为知识,再把知识转化为智慧,智慧可以转化为新的知识,新知识又可转化为新的信息,这是一种动态的开拓过程。信息信息 知识知识 情报情报 文献文献第5页,此课件共73页哦情报是为解决某一特定问题所需要的知识。只有将特定的知识传递给特定需要的人,特定的知识才被称之为情报。因此,知识性、传递性和效用性是情报的三个基本属性。信息信息 知识知识 情报情报 文献文献第6页,此课件共

4、73页哦文献是记录有知识的一切载体。凡是用文字、图形、符号、声像等手段记录下来,印在纸上或摄制在胶片上,录在唱片或磁带上,存储在计算机磁带、磁盘或光盘等物质载体之上的知识或信息统称为文献。知识性、记录性和物质性是文献的三个基本属性。信息信息 知识知识 情报情报 文献文献第7页,此课件共73页哦信信 息息 的的 类类 型型 1按产生信息的客体性质来划分(1)自然信息 是指自然界中的各种信息,包括瞬时发生的声、光、热、电、形形色 色的天气变化、缓慢的地壳运动、天体演化等等。(2)生物信息 是指生物为繁衍生存而表现出来的各种形态和行为,如遗传信息、生 物体内信息交流、动物种群内的信息交流等。(3)社

5、会信息 是指人类各种活动所产生、传递与利用的信息,包括人与人之间交流 的信息,人与机器之间作用的信息。按照人类活动领域,社会信息又可分为科技信息、经济信息、政治信 息、军事信息、文化信息等。第8页,此课件共73页哦信信 息息 的的 类类 型型2按信息的内容加工层次来划分(1)零次信息 是指记录在非正规物理载体上的、未经加工整理的信息,如书信、笔记、手稿、考察 记录、实验记录等。这类信息往往呈现为零星的、分散的和无规则的状态,具有原始 性、新颖性、分散性和不可检索性等特征。(2)一次信息 一次信息是指记录在正规载体上的、经过一定加工整理的信息,即以作者本人的生产 和科研工作为依据而创作的原始信息

6、,如专著、论文、研究报告、专利说明书、技术 标准等。一次信息具有创造性、系统性和新颖性等特征。(3)二次信息 二次信息是指将分散的、无序的一次信息进行加工整理后,使之成为系统有序的信 息,如书目、题录、文摘、索引等,就是通常所指的检索工具。二次信息具有浓缩 性、汇集性和有序性等特点。(4)三次信息 三次信息是根据二次信息提供的线索,利用一次信息,经过调研、分析、综合后而形 成的信息,如述评、综述、进展报告、数据手册和年鉴等。三次信息具有较强的概括 性,成为人们研究新事物的具体结论和成果。第9页,此课件共73页哦信信 息息 的的 类类 型型3按信息所依附的载体来划分 (1)口语信息 是指存在于人

7、脑记忆中,通过交谈、讨论、报告等方式交流传播的信息。它反映了人们的思考、见解、看法和观点,是推动研究的最初起源。口语信息具有出现早、传递快、偶发性强的特点,但缺乏完整性和系统性,大部分转瞬即逝,一部分通过文献保存,一部分留存在人类的记忆中,代代相传而称为口述回忆或口碑资料。作为信息留存的一种形式,口语信息无时不在,无处不有,承载着人类的知识、经验和史实,是一种需要重视和开发的极为丰富的资源。(2)实物信息 是指固化在实物中的信息,实物包括自然实物和人工实物(如文物、产品样本、模型、碑刻、雕塑等)。其特点是直观性强、感觉实在、信息量大,但需要通过知识、智慧、经验和工具来挖掘其隐含的大量信息。第1

8、0页,此课件共73页哦信信 息息 的的 类类 型型(3)文献信息 是指以文献作为载体形式所表达的内载信息,即以文字、图形、符号、声频、视频等方式记录在各种载体上的信息。文献信息也是一种相对固化的信息,一经“固定”在某种载体上就不能随外界的变化而变化。这种性质的优点是,易识别、易保存、易传播;缺点是不能随外界的变化而变化,固态化是文献信息老化的原因。(4)数字信息 亦可称为电子信息,是指以数字代码方式将文字、图形、图像、声音、动画等存储在磁带、磁盘、光盘等介质上,以电信号、光信号的形式传输,并通过网络通信、计算机及其终端设备再现出来的一种信息。数字信息是计算机技术、通信技术、多媒体技术和高密度存

9、储技术迅速发展的产物。它需要用计算机才能读取信息,具有存储容量大、存取速度快、体积小、可共享等特点。这是当今发展最快、最具应用价值和发展前景的新型信息。第11页,此课件共73页哦信信 息息 资资 源源 的的 概概 念念 信息作为一种客观存在的自然和社会财富,其来源称为信息资源。信息资源是指一切能够产生信息或为了传递而存有信息的系统。它包括信息生成源和加工整理后的再生源。凡是产生和持有信息,并能传递或透露信息的人、物体和机构,都可称之为信息资源。信息资源可分为自然信息资源和社会信息资源。前者广泛存在于自然界中,是事物运动和生物生存活动的结果,人们通过自然信息资源的利用来认识世界,例如,科学技术信

10、息;后者则存在于人类活动之中,是社会的直接产物,使人类从事各种活动的基础,例如,政策法规信息、社会发展信息、市场信息、金融信息等。第12页,此课件共73页哦信信 息息 资资 源源 类类 型型 1.口语信息资源 口语信息资源是人类以口头语言所表述出来而未被记录下来的信息资源,它们在特定的场合被信息接收方直接消费并且能够辗转相传而为更多的人们所利用,如谈话、聊天、授课、讲演、讨论、唱歌、打电话、听广播、看电视等活动都是以口语信息资源的交流和利用为核心的。第13页,此课件共73页哦信信 息息 资资 源源 类类 型型2.实物信息资源 实物信息资源是指由实物本身来存储和表现知识信息的信息资源,人类传承的

11、知识有许多被物化在各类物体之中,如工具、设备、武器、产品样本、模型、碑刻、雕塑、建筑物等。通过实物信息资源往往可以获取直接为生产服务的技术信息,如关于物体的生产、结构、成分、功能、用途、发展等方面的情况。实物信息获取的主要目标首先是高技术实物,实物的技术水平越高,则所含信息价值越大,从中获取的信息质量就高。其次是实物样品,实物样品的原始程度越高,所含信息就越真实,如采集植物标本、矿物样品、产品样本等可以获取可靠的信息。第14页,此课件共73页哦信信 息息 资资 源源 类类 型型 3.文献信息资源 文献信息资源以记录方式和载体材料为依据可划分为:书写型、印刷型、缩微型、机读型和声像型五大类。(1

12、)书写型文献信息资源:一般以纸张为载体,记录方式为人工抄 写,包 括手稿、信件、日记、原始档案等。(2)印刷型文献信息资源:主要以纸张为载体,记录方式主要是印刷技术,包括油印、铅印、胶印、木板印刷、复印、激光打印等。(3)缩微型文献信息资源:以感光材料为载体,记录方式主要是光学记录技 术,主要类型有缩微胶卷、缩微平片、缩微卡片等。(4)机读型文献信息资源:以磁性材料为载体,记录方式为磁录技术,主要 类型有磁带、磁盘、软盘、光盘等。(5)声像型文献信息资源:以感光材料和磁性材料为载体,记录方式为光录 技术和磁录技术,主要类型有唱片、录音录像带、电影胶卷、胶片、幻 灯片等。第15页,此课件共73页

13、哦信信 息息 资资 源源 类类 型型这里着重介绍一些主要的文献信息源:这里着重介绍一些主要的文献信息源:(1 1)图书 图书是指论述或介绍某一学科或领域知识的出版物。图书往往是作者对已图书是指论述或介绍某一学科或领域知识的出版物。图书往往是作者对已经发表的科研成果及其知识体系进行概括和总结,即具有独立的内容体系、经发表的科研成果及其知识体系进行概括和总结,即具有独立的内容体系、相当篇幅和完整装帧形式的文献。相当篇幅和完整装帧形式的文献。其特点:其特点:内容比较成熟,所提供的知识系统、全面,出版形式也较固内容比较成熟,所提供的知识系统、全面,出版形式也较固定,是系统掌握各学科知识的基本资料。但出

14、版周期较长,传递报道速定,是系统掌握各学科知识的基本资料。但出版周期较长,传递报道速度较慢。度较慢。(2 2)期刊 期刊是指有固定名称、统一出版形式和一定出版规律的定期或不定期的连续出期刊是指有固定名称、统一出版形式和一定出版规律的定期或不定期的连续出版物。版物。期刊最突出的特点:期刊最突出的特点:出版迅速、内容新颖、能迅速反映科学技术研究成果的新信息。出版迅速、内容新颖、能迅速反映科学技术研究成果的新信息。期刊还具有连续性的特点,因而能为报导不断发展着的知识提供良好的条件。这一特期刊还具有连续性的特点,因而能为报导不断发展着的知识提供良好的条件。这一特点,使期刊成为人们寻找研究上的新发现、新

15、思想、新见解、新问题的首要信息源。点,使期刊成为人们寻找研究上的新发现、新思想、新见解、新问题的首要信息源。第16页,此课件共73页哦信信 息息 资资 源源 类类 型型(3 3)会议文献 会议文献是指在各种会议上宣读和交流的论文、报告和其他有关资料。会议文献是指在各种会议上宣读和交流的论文、报告和其他有关资料。会议文献的特点:会议文献的特点:专业性强、内容新颖、学术水平高、出版发行较快。专业性强、内容新颖、学术水平高、出版发行较快。会议文会议文献往往能代表某一学科领域的最新的研究成果及水平,从中可了解国内外科技发展趋献往往能代表某一学科领域的最新的研究成果及水平,从中可了解国内外科技发展趋势,

16、有较大的参考价值,是重要的信息来源之一。势,有较大的参考价值,是重要的信息来源之一。(4 4)专利文献 专利文献是记录有关发明创造信息的文献,蕴含着技术信息、法律信息和经济信息。广义的专利专利文献是记录有关发明创造信息的文献,蕴含着技术信息、法律信息和经济信息。广义的专利包括专利申请书、专利说明书、专利公报和专利检索工具,以及与专利有关的一切资料;狭义的专包括专利申请书、专利说明书、专利公报和专利检索工具,以及与专利有关的一切资料;狭义的专利仅指各国专利局出版的专利说明书。利仅指各国专利局出版的专利说明书。专利说明书是指专利申请人向专利局递交的有发明目的、构成和效果的技术文件。它经专专利说明书

17、是指专利申请人向专利局递交的有发明目的、构成和效果的技术文件。它经专利局审核后,向全世界出版发行。专利说明书内容比较具体,有的还有附图,通过它可以了利局审核后,向全世界出版发行。专利说明书内容比较具体,有的还有附图,通过它可以了解该项专利的主要技术内容。解该项专利的主要技术内容。构成专利要符合构成专利要符合新颖性、创造性和实用性新颖性、创造性和实用性三个基本条件。三个基本条件。第17页,此课件共73页哦信信 息息 资资 源源 类类 型型(5 5)科技报告 科技报告是指国家政府部门或科研生产单位关于某项研究成果的总结报告,或是研究过程中的阶段进展报告。报告的出版特点:各篇单独成册,统一编号,由主

18、管机构连续出版。在内容方面,报告比期刊论文新颖专深、详尽、可靠,出版周期短,报道速度快,能反映一个国家或某一学科领域的科研水平,是一种不可多得的信息源。科技报告按发行范围可分为绝密报告、机密报告、秘密报告、非密报告、解密报告。(6 6)标准文献 标准文献指标准化工作的文件,是经过公认的权威当局批准的标准化工作成果。其中主要为有关工业产品和工程建设的质量、规格和检验方法的技术规定文件。一个国家的标准文献反映该国的生产工艺水平和技术经济政策,而国际现行标准则代表了当前世界水平。国际标准和工业先进国家的标准常是科研生产活动的重要依据和信息来源。第18页,此课件共73页哦信信 息息 资资 源源 类类

19、型型(7 7)学位论文 学位论文是指高等院校、科研单位的研究生为申请硕士、博士等学位,在导师指导下完成的学位论文是指高等院校、科研单位的研究生为申请硕士、博士等学位,在导师指导下完成的科学研究、科学试验成果的学术论文。科学研究、科学试验成果的学术论文。硕士论文一般能表明作者在某门学科上掌握了坚实的基本理论和系统的专门知识,并对所研究硕士论文一般能表明作者在某门学科上掌握了坚实的基本理论和系统的专门知识,并对所研究的课题有新的见解,有从事科学研究工作的能力。的课题有新的见解,有从事科学研究工作的能力。博士论文一般能表明作者在某门学科上掌握了坚实宽广的基本理论和系统深入的专门知识,并具有独立博士论

20、文一般能表明作者在某门学科上掌握了坚实宽广的基本理论和系统深入的专门知识,并具有独立从事科学研究工作的能力,在科学研究或专门学术领域具有创造性成果。从事科学研究工作的能力,在科学研究或专门学术领域具有创造性成果。(8 8)产品资料 产品资料指产品目录、产品样本和产品说明书一类的厂商为向客户宣传和推销其产品而印发的介绍产品产品资料指产品目录、产品样本和产品说明书一类的厂商为向客户宣传和推销其产品而印发的介绍产品情况的文献。情况的文献。产品目录介绍厂家业务范围、列出产品名称型号、并附有产品外型、规格、用途的简单介绍。产品目录介绍厂家业务范围、列出产品名称型号、并附有产品外型、规格、用途的简单介绍。

21、产品样本多以活页形式印发,是对定型产品的型号、技术规格、原理性能、技术参数所作的具体介绍,产品样本多以活页形式印发,是对定型产品的型号、技术规格、原理性能、技术参数所作的具体介绍,也附有结构图和照片。也附有结构图和照片。产品说明书的内容更详尽,往往还列出产品的工作原理、用途、效率、结构特点、操作规产品说明书的内容更详尽,往往还列出产品的工作原理、用途、效率、结构特点、操作规程、使用、保养和维修方法等。程、使用、保养和维修方法等。第19页,此课件共73页哦信信 息息 资资 源源 类类 型型 (9 9)档案文献 档案是国家机构、社会组织以及个人从事政治、军事、经济、科学、技术、文化、宗教等活动档案

22、是国家机构、社会组织以及个人从事政治、军事、经济、科学、技术、文化、宗教等活动形成的具有保存价值的历史记录文献。档案是在人们的社会实践活动中形成的,它的内容也反映形成的具有保存价值的历史记录文献。档案是在人们的社会实践活动中形成的,它的内容也反映了人们所进行的政治活动、生产活动和科学技术活动,所以档案的内容广泛、形式多样、材料来了人们所进行的政治活动、生产活动和科学技术活动,所以档案的内容广泛、形式多样、材料来源庞杂。源庞杂。经过整理后它们分别成为:文书档案、人事档案、会计档案、技术档案等等。经过整理后它们分别成为:文书档案、人事档案、会计档案、技术档案等等。技术档案指科研生产活动中形成的,有

23、具体事物对象的技术文件、图纸、图表、照片和原始记录等的总称。技术档案指科研生产活动中形成的,有具体事物对象的技术文件、图纸、图表、照片和原始记录等的总称。(1010)政府出版物 政府出版物是指各国政府部门及其设立的专门机构出版的文献。政府出版物是指各国政府部门及其设立的专门机构出版的文献。政府出版物的内容十分广泛,既有科学技术方面的,也有社会经济方面的,大致上可分两类:政府出版物的内容十分广泛,既有科学技术方面的,也有社会经济方面的,大致上可分两类:行政性文献(包括宪法、司法文献),主要涉及政府法律、经济方面的国会和议会记录、议案、决议、行政性文献(包括宪法、司法文献),主要涉及政府法律、经济

24、方面的国会和议会记录、议案、决议、司法资料、听证记录、法律、法令、规章制度、政策、调查统计资料等。司法资料、听证记录、法律、法令、规章制度、政策、调查统计资料等。科学技术文献,主要指政府部门出版的科技报告、标准、专利文献、科技政策文件,公开后的科学技术文献,主要指政府部门出版的科技报告、标准、专利文献、科技政策文件,公开后的科技档案、经济规划、气象资料等。科技档案、经济规划、气象资料等。第20页,此课件共73页哦信信 息息 资资 源源 类类 型型4数字信息资源 数字信息资源是在计算机技术、通信技术和高密度存贮技术的迅速发展并在各个领域里得到广泛应用的环境下产生的一种信息资源形式。它是指经过数字

25、化处理的,可通过计算机系统或通信网络 等识别、传递、浏览的信息资源。第21页,此课件共73页哦计算机信息检索基础知识“检索”的英文是“Retrieval”,其涵义是“查找”。将信息按 一定的方式和规律排列存储,并针对用户特定需求查找出 所需信息的过程称为信息检索。信息检索是从任何信息集合中识别和获取所需信息的过程 及其所采取的一系列方法和策略。从广义来说,信息检索包括存储过程和检索过程;对信息 用户而言,往往是指查找所需信息的检索过程。信息检索根据其检索对象和结果的不同可分为:数据检索、文献检索、事实检索 由于信息大多来源于文献,离不开文献这一范畴,国内外 对信息检索和文献检索往住不作严格区分

26、。第22页,此课件共73页哦计算机信息检索基础知识文献信息检索 是以文献(包括题录、文摘和全文)为检索对象的信息检索。即利用 相应的方式与手段,在存贮文献的检索工具或文献数据库中,查寻用 户在特定的时间和条件下所需文献的过程。凡 是 查 找 某 一 主 题、时 代、地 区、著 者、文 种 的 有 关 文 献,以 及 回 答 这些文献的出处和收藏处所等,都属于文献型信息检索的范畴。它为用户提供的是与用户的信息需求相关的文献信息。这些文献可以 是涉及某一主题、学科、著者、文种、年代的文献;文献的收藏范围 可以是一馆、一地、一国直至全世界。文献检索的结果提供与课题相关的数篇文献的线索或原文供用户参

27、考,这些相关文献的相关程度随检索系统和检索技术的优劣可以有很 大区别。完成文献信息检索主要借助于各种书目数据库和全文数据库。第23页,此课件共73页哦计算机信息检索基础知识数据信息检索 是 以 数 值 或 图 表 形 式 表 示 的 数 据 为 检 索 对 象 的 信 息 检 索,又 称“数 值 检 索”。即 检 索 系 统 中 存 贮 的 是 大 量 的 数 据,它 包 括 物 质 的 各 种 参 数、电 话 号 码、银 行 账 号、观 测 数 据、统 计 数 据 等 数 字 数 据,也 包 括 图 表、图 谱、市 场 行 情、化 学分子式、物质的各种特性等非数字数据,并提供一定的 运算推导

28、能力。数据检索是一种确定性检索,信息用户检索到的各种数据 是经过专家测试、评价、筛选过的,可直接用来进行定量 分析。数据检索与文献检索有许多共同之处,文献检索的 许多方法也适用于数据检索。完成数据信息检索主要借助于各种数值数据库。第24页,此课件共73页哦计算机信息检索基础知识事实信息检索 是以从文献中抽取的事项为检索内容的信息检索,又称 “事 项 检 索”。其 检 索 对 象 既 包 括 事 实、概 念、思 想、知 识 等 非 数 值 信 息,也 包 括 一 些 数 据 信 息,但 要 针 对 查 询 要求,由检索系统进行分析、推理后,再输出最终结 果。事实检索是信息检索中最复杂的一种,要求

29、检索系统必 须有一定的逻辑推理能力和自然语言理解功能。事 实 检 索 也 是 一 种 确 定 性 检 索,用 户 获 得 的 是 有 关 某 一 事物的具体答案。完成事实信息检索主要借助于各种指南数据库和全文数 据库。第25页,此课件共73页哦计算机信息检索基础知识随着计算机技术、通信技术和高密度存储技术的迅猛发展,利用计算机进行信息检索已成为人们获取文献信息的重要手段。计算机信息检索能够跨越时空,在短时间内查阅各种数据库,还能快速地对几十年前的文献资料进行回溯检索,而且大多数检索系统数据库中的信息更新速度很快,检索者随时可以检索到所需的最新信息资源。科学研究工作过程中的课题立项论证、技术难题

30、攻关、跟踪前沿技术、成果鉴定和专利申请的科技查新等都离不开查询大量的相关信息。计算机信息检索是目前最快速、最省力、最经济的信息检索方法。第26页,此课件共73页哦计算机信息检索基础知识计算机信息检索原理 计算机信息检索是指利用计算机存储和检索信息。具体地说,就是指人们在计算机或计算机检索网络的终端机上,使用特定的检索指令、检索词和检索策略,从计算机检索系统的数据库中检索出所需的信息,继而再由终端设备显示或打印的过程。为实现计算机信息检索,必须事先将大量的原始信息加工处 理、以数据库的形式存储在计算机中,所以计算机信息检索广义上讲包括信息的存储和检索两个方面。第27页,此课件共73页哦计算机信息

31、检索基础知识计算机信息存储过程:用手工或者自动方式将大量的原始信息进行加工,具体做法是将收集到的原始文献进行主题概念分析,根据一定的检索语言抽取出主题词、分类号以及文献的其他特征进行标识或者写出文献的内容摘要。然后再把这些经过“前处理”的数据按一定格式输入计算机存储起来,计算机在程序指令的控制下对数据进行处理,形成机读数据库,存储在存储介质(如磁带、磁盘或光盘)上,完成信息的加工存储过程。第28页,此课件共73页哦计算机信息检索基础知识计算机信息检索过程:用户对检索课题加以分析,明确检索范围,弄清主题概念,然后用系统检索语言来表示主题概念,形成检索标识及检索策略,输入到计算机进行检索。计算机按

32、照用户的要求将检索策略转换成一系列提问,在专用程序的控制下进行高速逻辑运算,选出符合要求的信息输出。计算机检索的过程实际上是一个比较、匹配的过程,检索提问只要与数据库中的信息的特征标识及其逻辑组配关系相一致,则属“命中”,即找到了符合要求的信息。第29页,此课件共73页哦计算机信息检索基本原理计算机信息检索基本原理第30页,此课件共73页哦计算机信息检索系统的组成 1.1.计算机计算机 计算机是检索系统的核心部分,通过一定的检索软件,进行信息的存储、处理、检索以及整个系统的运行和管理。2.2.通信网络通信网络 通信网络是联系计算机系统和检索终端设备的桥梁,起着远距离、高速度、无差错传递信息的作

33、用。检索网络所用的通信线路,一般是公用电话线或专用线,国际联机检索系统则是由通信卫星和海底电缆构成的通信网络。第31页,此课件共73页哦3.3.检索终端设备检索终端设备 检 索 终 端 设 备 是 用 户 与 检 索 系 统 相 互 传 递 信 息,进 行 “人机 对 话”的装置,现在基本上都是PC机终端,通常 由计算机、调制解调器和打印机组成。4.4.数据库数据库 数据库就是在计算机存储设备上按一定方式存储的相 互关联的数据集合。是检索系统的信息源,也是用户检 索的对象。数据库可以随时按不同的目的提供各种组合 信息,以满足检索者的需求。检索系统(检索平台)中的数据库一般由各个数据库 生产商提

34、供,也有一些是系统本身建的。第32页,此课件共73页哦计算机信息检索的发展 1.脱机批处理检索阶段 在利用计算机进行信息检索的早期,人们只是用单台计算机的输入输 出装置进行检索,用磁带作存储介质,一般为连续的顺序检索方式。检索部门把许多用户的检索提问汇总到一起,进行批量检索,然后把 检索结果通知各个用户,用户不直接接触计算机。2.联机检索阶段 20世纪60年代末,由于计算机软硬件技术的不断提高,出现了一台主 机带多个终端的联机信息检索系统。这种系统具有分时的操作能力,能够使许多相互独立的终端同时进行检索。这种系统采用实时操作技 术,所以用户可以使用终端设备直接与计算机进行“人机对话”,计 算机

35、对用户的提问能及时处理并显示出结果。第33页,此课件共73页哦3.光盘检索阶段 光盘是一种用激光记录和读取信息的盘片,具有信息存取密度高、容 量 大、读 取 速 度 快、信 息 类 型 多、保 存 时 间 长、成 本 低 等 优 点。它 是80年代在计算机技术、激光技术和精密伺服电机技术等现代科学 技术成果的基础上发展起来的新型电子出版物。光盘数据库的类型不 断丰富,除了最初的书目数据库外,又增加了文摘数据库、数值事实 参考数据库、全文数据库等等,并且还出现了图像型、音频型、软件 型和多媒体型等多种形式的CD-ROM产品。4.网络化检索阶段 进 入20世 纪90年代,图书馆、信息服务机构和科研

36、机构以及一些大的 数 据 库 生 产 商 纷 纷 加 入 到 因 特 网 上,为 信 息 需 求 者 提 供 各 种 各 样 的 信 息服务,构成极其丰富的网络信息资源。第34页,此课件共73页哦数据库的类型1.1.文献书目数据库文献书目数据库(Bibliographic Databases(Bibliographic Databases)文献书目数据库是存储某个领域原始文献的书目,即二次文献数据库,记录内容包括文献的题目、著者、原文出处、文摘、主题词等。大多数是印刷本检索工具的机读 版,如 美 国 工 程 索 引 数 据 库(E i C o m p e n d e x)等。2.2.信息指南数

37、据库信息指南数据库(Dictionary Databases)(Dictionary Databases)信息指南数据库主要是记录一些机构、人物、产品、项目简述等事实数据,通过该类数据库可以查到公司、机构的地址、电话、产品目录、研究项目或名人简历等信息。这类数据库也称为事实数据库。第35页,此课件共73页哦3.3.数值型数据库数值型数据库(Numeric Databases)Numeric Databases)数值数据库是专门提供以数据形式表示信息的一种源数据库。主要记录科学研究中试验、测量、计算、工程设计、经济分析和工业规划等方面的数据。这类数据库主要包含数值数据,有的也包含文字,文字是用来

38、定义数据所需的最小量的文字。4.4.全文数据库全文数据库(Complete Text Databases)Complete Text Databases)全文数据库是存储文献内容全文或其中主要部分的数据库,简称全文库。它是将经典著作、学术期刊、重要的会议录、法律法规、新闻报道以及百科全书、手册、年鉴等的全部文字和非文字内容转换成计算机可读形式。全文数据库可以解决用户获取一次文献所遇到的困难,能向用户提供一步到位的查找原始文献的信息服务。第36页,此课件共73页哦数据库的记录格式 数据库的记录是构成数据库顺排文档(主文档)的基本单元,是对某一实体属性进行描述的结果。在书目数据库中,被描述的实体是

39、某一特定的文献,通常被称作文献记录。一条记录又包含若干个数据字段。这些数据字段就是原始文献的篇名、著者、文献出处、出版时间、文摘、主题词、语种等。为了方便计算机检索,每一个字段都有自己特定的标识符,称为字段名或字段代码,如AB代表文摘字段、TI代表篇名字段、AU代表著者字段等。数据库记录的字段往往都是提供对该文献的检索途径。第37页,此课件共73页哦 Accession number:06209880131 Title:Practical methods to define scattering coefficients in a room acoustics computer model A

40、uthors:Zeng,Xiangyang;Christensen,Claus Lynge;Rindel,Jens Holger Author affiliation:Institute of Environmental Engineering,Northwestern Polytechnical University,Xian,710072,China Serial title:Applied Acoustics Abbreviated serial title:Appl Acoust Volume:v 67 Issue:n 8 Issue date:August 2006 Publicat

41、ion year:2006 Pages:p 771-786 Language:English ISSN:0003-682X CODEN:AACOBL Document type:Journal article(JA)Publisher:Elsevier Ltd,Oxford,OX5 1GB,United Kingdom Abstract:To predict acoustics of rooms using computer programs based on geometrical assumptions,it is important that scattering is included

42、 in the calculations.Therefore scattering is usually included in terms of scattering coefficients which are assigned to each surface telling the software the ratio between the part of the reflected energy which is not being reflected specularily and the total reflected energy.However the effective s

43、cattering coefficient of a surface depends not only on the roughness of the surface material indeed diffraction caused by limited dimensions of the surface as well as edge diffraction also causes scattering.Number of references:24 Ei main heading:Acoustics Ei controlled terms:Computer simulation -Ac

44、oustic wave scattering -Computational geometry -Surface roughness -Acoustic wave diffraction Uncontrolled terms:Scattering coefficient -Room acoustics -Computer model Ei classification codes:751 Acoustics,Noise.Sound -723.5 Computer Applications -751.1 Acoustic Waves -921.4 Combinatorial Mathematics

45、,Includes Graph Theory,Set Theory -931.2 Physical Properties of Gases,Liquids&Solids Treatment:Theoretical(THR)第38页,此课件共73页哦记录中的字段标识及对应名称说明如下记录中的字段标识及对应名称说明如下:AN:(DIALOG Accession Number),DIALOG存取号,在一个数据库中,每篇 记录只有一个存取号,每个号只配给一条记录,两者一一对应。DIALOG 存取号后常跟各数据库的文摘号,与相应的检索刊物一致。TI:(Title)篇名字段AU:(Author)著者字段C

46、S:(Corporate Source)著者所在单位字段SO:(Source Publication)文献出处字段,对于期刊文献包括期刊名称、卷、期 页等;对于会议文献包括会议名称、届次、时间、地点等PY:(Publication Year)出版年代字段。CO,SN:(CODEN),(ISSN)期刊代码,国际连续出版物标准号LA:(Language)语种字段指原文语种DT:(Document Type)文献类型字段TC:(Treatment Code)处理码字段,表示论文研究的性质,A表示应用,X表示 实验,T表示理论,等等AB:(Abstract)文摘字段DE:(Descriptor)叙词字

47、段,主题词表中的词ID:(Identifier)自由标引词字段,非受控词表中的词,由标引人员根据文献内容 确定CC:(Classfication Code)分类代码字段第39页,此课件共73页哦检索语言计算机检索的基本原理是,将用户的检索提问词与数据库文献记录中的标引词进行对比,当提问词与标引词匹配一致时,即为命中,检索成功。用户所选用的检索词必须与数据库中标引文献记录所用的标引词相一致。检索语言就是为沟通文献标引与文献检索而编制的人工语言,也是用于文献标引和检索提问的约定语言。如果没有检索语言作为标引人员和检索人员的共同语言,就很难使得标引人员对文献信息内容的表达和检索人员对相同文献信息内容

48、需求时的表达取得一致,信息检索也就不可能顺利实现。因此,编制检索语言的目的就是能够保证检索提问词与文献标引词的一致性。检索语言所表达的概念应该是唯一的,尽量减少一词多义或多词一义的现象,要使其在检索系统中具有单义性。第40页,此课件共73页哦1.1.分类语言分类语言 分类语言是以学科体系为基础,用号码作为概念标识,按分类编 排的检索语言。国内外比较重要的分类语言表有国际专利分类表、杜威十进分类法、中国图书馆图书分类法等。2.2.主题语言主题语言 主题语言是以语词作为概念标识,按字顺编排的检索语言。主题语言包括标题词语言、单元词语言、叙词语言和关键词语言。(1)标题词语言最早使用的一种主题语言。

49、它以规范化的自然语义作为标识,来表达文献涉及的主题概念,并将全部标识按字母顺序排列。表达主题的词语称为标题词。(2)单元词语言是从文献内容中抽选出来的最基本的词汇,将代表最一般、最基本的、不可再分割的概念单元的词作为单独标引文献的单位。(3)叙词语言从自然语言中优选出来并经过规范化处理的名词术语。叙词语言是采用表示单元概念的规范化语词的组配来对文献内容主题进行描述的检索语言,也是目前使用最广泛的主题语言。(4)关键词语言直接从文献题名、文摘或正文中抽取出来的未经规范化处理的词。是一种用自然语言做标识的检索语言。第41页,此课件共73页哦计算机信息检索技术1 1布尔逻辑检索布尔逻辑检索 在检索实

50、际中,检索提问涉及的概念往往不止一个,而同一个概念又往往涉及多个同义词或相关词。为了正确地表达检索提问,系统中采用布尔逻辑运算符将不同的检索词组配起来,使一些具有简单概念的检索单元通过组配成为一个具有复杂概念的检索式。(1 1)逻辑)逻辑“与与”逻辑“与”(用and或*表示)是一种用于交叉概念或限定关系的组配,它可以缩小检索范围,有利于提高检索的专指性。如欲查同时含有概念A和概念B的文献,可表示为:“A and B”或“A*B”。第42页,此课件共73页哦(2 2)逻辑)逻辑“或或”逻辑“或”(用OR或“+”表示)是用于具有并列概念关系的组配。这种组配可以扩大检索范围,提高查全率。例如,检索含

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 资格考试

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁