《信息资源检索概述.ppt》由会员分享,可在线阅读,更多相关《信息资源检索概述.ppt(88页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、信息资源检索与利用西安石油大学图书馆连宇江2011.82011年8月第一章_信息资源检索概述2课程主要内容第一章第一章 信息资源检索概述信息资源检索概述第二章第二章 参考数据库资源检索参考数据库资源检索第三章第三章 全文数据库资源检索全文数据库资源检索第四章第四章 数据与事实信息资源检索数据与事实信息资源检索第五章第五章 网上其它信息资源检索网上其它信息资源检索第六章第六章 信息资源检索的综合利用信息资源检索的综合利用2011年8月第一章_信息资源检索概述3第一章信息资源检索概述一、信息资源的分类一、信息资源的分类二、信息资源的检索二、信息资源的检索三、信息资源的检索方法和技术三、信息资源的检
2、索方法和技术四、信息资源检索的效果评价四、信息资源检索的效果评价2011年8月第一章_信息资源检索概述4第一节信息资源分类1.1信息信息 信息一词最早出自拉丁语,意思是通知、报道和消信息一词最早出自拉丁语,意思是通知、报道和消息。同时,也多见于我国古代的诗词中,其所说的信息,息。同时,也多见于我国古代的诗词中,其所说的信息,指指“音信音信”、“消息消息”意思,与今天人们对信息的认识意思,与今天人们对信息的认识没有本质的区别。没有本质的区别。2011年8月第一章_信息资源检索概述5 信息作为一个科学术语,最早出现于通信领信息作为一个科学术语,最早出现于通信领域,域,2020世纪中叶后被引入哲学、
3、信息论、系统论、世纪中叶后被引入哲学、信息论、系统论、控制论、情报学、经济学、管理学、计算机等领控制论、情报学、经济学、管理学、计算机等领域。信息的广泛应用,导致们对信息的认识和定域。信息的广泛应用,导致们对信息的认识和定义上的差别。义上的差别。哲学家认为:信息是认识世界的一种依据。哲学家认为:信息是认识世界的一种依据。信息是被其他事物感知的、表征该事物特征信息是被其他事物感知的、表征该事物特征的信号内容,即该事物向其他事物传递的信的信号内容,即该事物向其他事物传递的信号。号。信息论的创始人申农()认为,信息是用来信息论的创始人申农()认为,信息是用来减少随机不确定的东西,即信息是一种不定减少
4、随机不确定的东西,即信息是一种不定度。他是从通信系统理论的角度上讲的。度。他是从通信系统理论的角度上讲的。数学家认为信息是一种概念。即信息数学家认为信息是一种概念。即信息熵这个概念,它是衡量对某种事物认熵这个概念,它是衡量对某种事物认识的不确定度,即信息的有序度。识的不确定度,即信息的有序度。控制论专家控制论专家N维纳对信息的定义是维纳对信息的定义是“信息就是我们适合外部世界进行信息就是我们适合外部世界进行交换的内容的名称交换的内容的名称”。新闻界普通认为,信息是对事物运动新闻界普通认为,信息是对事物运动状态的陈述,是物与物、物与人、人状态的陈述,是物与物、物与人、人与人之间的特征传输。与人之
5、间的特征传输。心理学家认为,信息是存在于意识之心理学家认为,信息是存在于意识之外,它存在于自然界、印刷品、硬盘外,它存在于自然界、印刷品、硬盘以及空气之中。以及空气之中。经济学家认为,信息是与物质、能量相并经济学家认为,信息是与物质、能量相并列的客观世界的三大要素之一列的客观世界的三大要素之一(信息、物信息、物质和能源质和能源),是为管理和决策提供依据的,是为管理和决策提供依据的有效数据。有效数据。2011年8月第一章_信息资源检索概述6情报领域比较认同的看法是:情报领域比较认同的看法是:信息是事物存在的方式和运信息是事物存在的方式和运动状态的表征,信息并非事物本身,而是事物发出的体动状态的表
6、征,信息并非事物本身,而是事物发出的体现它存在和运动状态的信号和消息。因此我们说:信息现它存在和运动状态的信号和消息。因此我们说:信息是客观事物的存在方式与运动规律以及人们对这一切的是客观事物的存在方式与运动规律以及人们对这一切的看法与表述。看法与表述。信息的功能主要表现在:信息的功能主要表现在:一是可深化人们对于世界的科学认识,有助于人们不断地揭一是可深化人们对于世界的科学认识,有助于人们不断地揭示客观世界;示客观世界;二是可以消除人们在认识上的某种不定性。人类认识世界,二是可以消除人们在认识上的某种不定性。人类认识世界,就是不断地从外界获取信息和加工信息的过程。就是不断地从外界获取信息和加
7、工信息的过程。三是信息可向人们不断提供知识和情报。它和物质、能量一三是信息可向人们不断提供知识和情报。它和物质、能量一样是一种社会的基本资源。随着人类社会的发展,信息在社会中样是一种社会的基本资源。随着人类社会的发展,信息在社会中发挥的作用越来越重要。发挥的作用越来越重要。2011年8月第一章_信息资源检索概述71.2信息资源信息资源 信息是普遍存在的,但并非所有的信息都是信息资源,信息是普遍存在的,但并非所有的信息都是信息资源,信息只有经过人类加工后,可被利用的信息才可称为信信息只有经过人类加工后,可被利用的信息才可称为信息资源。息资源。“信息资源信息资源”的概念是随着现代信息技术,特的概念
8、是随着现代信息技术,特别是计算机技术和信息资源管理理论的发展和普及而为别是计算机技术和信息资源管理理论的发展和普及而为人们所接受的。人们所接受的。孟广均等人在孟广均等人在信息资源管理导论信息资源管理导论中阐述中阐述“信息源不等于信息源不等于信息资源,信息资源是可利用的信息的集合,是高质量、高纯度信息资源,信息资源是可利用的信息的集合,是高质量、高纯度的信息源。的信息源。”卢泰宏和孟广均曾在卢泰宏和孟广均曾在 1992 年编译的年编译的信息资源管理专集信息资源管理专集中将美国学者对中将美国学者对“信息资源信息资源”的理解概述为:信息资源的理解概述为:信息资源=文献信文献信息;信息资源息;信息资源
9、=数据;信息资源数据;信息资源=多种媒介和形式的信息(包括文多种媒介和形式的信息(包括文字、图像、声音、印刷品、电子信息、数据库);信息资源字、图像、声音、印刷品、电子信息、数据库);信息资源=信信息活动中各种要素的总称(包括信息、设备、技术和人等)。息活动中各种要素的总称(包括信息、设备、技术和人等)。2011年8月第一章_信息资源检索概述8 由此可以看出信息资源还是一个发展中的概念,是由此可以看出信息资源还是一个发展中的概念,是一个具有丰富内涵的术语。一个具有丰富内涵的术语。1998 年,篓策群、桂学文二年,篓策群、桂学文二人在其主编的人在其主编的信息经济学通论信息经济学通论一书中指出,从
10、信息一书中指出,从信息资源所描述的对象来看,信息资源由自然信息资源、机资源所描述的对象来看,信息资源由自然信息资源、机器信息资源、社会信息资源、实物型信息资源组成;从器信息资源、社会信息资源、实物型信息资源组成;从载体和存储方式来看,信息资源由天然型信息资源、智载体和存储方式来看,信息资源由天然型信息资源、智力型信息资源、实物型信息资源和文献型信息资源构成;力型信息资源、实物型信息资源和文献型信息资源构成;从信息资源的内容来看,信息资源由政治、法律、军事、从信息资源的内容来看,信息资源由政治、法律、军事、经济、管理、科技等信息资源组成;从信息资源的反映经济、管理、科技等信息资源组成;从信息资源
11、的反映面来看,信息资源由宏观信息资源和微观信息资源组成;面来看,信息资源由宏观信息资源和微观信息资源组成;从信息资源的开发程度来看,信息来源由未开发的信息从信息资源的开发程度来看,信息来源由未开发的信息资源(信息原料)和已开发的信息资源(信息产品)组资源(信息原料)和已开发的信息资源(信息产品)组成。成。2011年8月第一章_信息资源检索概述9 可以说,信息时代更强调信息的可以说,信息时代更强调信息的收集、整理、加工收集、整理、加工和使用和使用。信息通过文字符号、声音或图像等形式存储在。信息通过文字符号、声音或图像等形式存储在各种载体上集合在一起就成了信息资源。物资和能源都各种载体上集合在一起
12、就成了信息资源。物资和能源都是不可再生的资源,而信息资源是一种可再生、可反复是不可再生的资源,而信息资源是一种可再生、可反复使用的资源,信息资源是经过人类选取、组织、序化的使用的资源,信息资源是经过人类选取、组织、序化的有用信息的集合。但是同样的信息资源会因使用者的不有用信息的集合。但是同样的信息资源会因使用者的不同而发掘出不同的信息。人们越来越清楚地意识到信息同而发掘出不同的信息。人们越来越清楚地意识到信息资源日益显著的作用,人类所从事的一切社会活动必须资源日益显著的作用,人类所从事的一切社会活动必须从利用信息资源入手,在未来社会竞争环境中,那些拥从利用信息资源入手,在未来社会竞争环境中,那
13、些拥有较多信息资源的个人、机构、国家将具有更大的竞争有较多信息资源的个人、机构、国家将具有更大的竞争优势。信息资源地位的上升,促进了以计算机和网络为优势。信息资源地位的上升,促进了以计算机和网络为核心的信息技术的进步,先进的信息技术反过来又把信核心的信息技术的进步,先进的信息技术反过来又把信息资源的开发作为重要的应用方面,例如使用现代信息息资源的开发作为重要的应用方面,例如使用现代信息技术可以为人们提供更多、更及时的有用信息。技术可以为人们提供更多、更及时的有用信息。2011年8月第一章_信息资源检索概述101.3信息资源的分类信息资源的分类 对事物进行分类,是人们认识事物的一种基对事物进行分
14、类,是人们认识事物的一种基本方法,人们要开发利用信息资源,就必须首先本方法,人们要开发利用信息资源,就必须首先了解信息资源的类型,信息资源的分类标准是多了解信息资源的类型,信息资源的分类标准是多种多样的,首先,按信息资源的存在状态可将其种多样的,首先,按信息资源的存在状态可将其分为潜在的信息资源和现实的信息资源两大类。分为潜在的信息资源和现实的信息资源两大类。潜在的信息资源是指个人在学习、认识和实践过潜在的信息资源是指个人在学习、认识和实践过程中存储在大脑中的信息资源。显然,现实信息程中存储在大脑中的信息资源。显然,现实信息资源是我们当前研究、开发、利用的重点。现实资源是我们当前研究、开发、利
15、用的重点。现实的信息资源依据其载体可分为体载信息资源、文的信息资源依据其载体可分为体载信息资源、文献信息资源、实物信息资源和网络信息资源。献信息资源、实物信息资源和网络信息资源。2011年8月第一章_信息资源检索概述11体载信息资源体载信息资源 体载信息资源指以人体为载体并能为他人识体载信息资源指以人体为载体并能为他人识别的信息资源,按其表达方式又可分为口语信息别的信息资源,按其表达方式又可分为口语信息资源和体语信息资源。口语信息资源是人类以口资源和体语信息资源。口语信息资源是人类以口头语言表达出来但未被记录下来的信息资源,如头语言表达出来但未被记录下来的信息资源,如谈话、授课、讲演、讨论等;
16、体语信息资源是以谈话、授课、讲演、讨论等;体语信息资源是以人的体态表达出来的信息资源,如表情、手势、人的体态表达出来的信息资源,如表情、手势、姿态、舞蹈等。姿态、舞蹈等。2011年8月第一章_信息资源检索概述12文献信息资源文献信息资源 文献信息资源是以文献为载体的信息资源。它又可按文献信息资源是以文献为载体的信息资源。它又可按文献信息资源的载体形式进行划分、按信息资源出版类文献信息资源的载体形式进行划分、按信息资源出版类型进行划分和按信息资源的内容加工层次进行划分。型进行划分和按信息资源的内容加工层次进行划分。(1)按文献信息资源载体形式进行划分按文献信息资源载体形式进行划分 印刷型信息资源
17、。印刷型信息资源。印刷型信息资源是一种传统的、印刷型信息资源是一种传统的、常见的信息资源,指通过油印、铅印、胶印等各种印刷常见的信息资源,指通过油印、铅印、胶印等各种印刷手段将信息记录在纸张上的信息资源。其特点是使用方手段将信息记录在纸张上的信息资源。其特点是使用方便,易于携带和阅读,但体积大,不易整理和保存。便,易于携带和阅读,但体积大,不易整理和保存。缩微型信息资源。缩微型信息资源。缩微型信息资源包括缩微胶卷和缩微型信息资源包括缩微胶卷和缩微平片,是指通过利用光学技术将信息记录在感光材缩微平片,是指通过利用光学技术将信息记录在感光材料上的信息资源。其特点是体积小、易保存、存储密度料上的信息
18、资源。其特点是体积小、易保存、存储密度高,但是它的使用需要专门的设备和环境。高,但是它的使用需要专门的设备和环境。2011年8月第一章_信息资源检索概述13 声像型信息资源。声像型信息资源。声像型信息资源包括唱片、录音声像型信息资源包括唱片、录音带、录像带、电影和幻灯片等,是指通过专门的设备,带、录像带、电影和幻灯片等,是指通过专门的设备,使用声、光、磁、电技术将信息以声音、图像等形式记使用声、光、磁、电技术将信息以声音、图像等形式记录下来的信息资源。其特点是直观形象,但需要专门的录下来的信息资源。其特点是直观形象,但需要专门的设备。设备。电子型信息资源。电子型信息资源。电子型信息资源是指通过
19、编码技电子型信息资源是指通过编码技术将信息转换为计算机可识别的语言,并将信息记录在术将信息转换为计算机可识别的语言,并将信息记录在磁带、磁盘、光盘上的信息资源。它需要用计算机才能磁带、磁盘、光盘上的信息资源。它需要用计算机才能读取信息,具有存储容量大、存取速度快、体积小、可读取信息,具有存储容量大、存取速度快、体积小、可共享的特点,但是它的价格较高,保存条件较高。电子共享的特点,但是它的价格较高,保存条件较高。电子型信息资源主要是指电子图书、电子期刊、电子会议录型信息资源主要是指电子图书、电子期刊、电子会议录等,如果这些电子型信息资源能够在因特网或局域网内等,如果这些电子型信息资源能够在因特网
20、或局域网内检索,那么它们就被视做网络信息资源。检索,那么它们就被视做网络信息资源。2011年8月第一章_信息资源检索概述14(2)按信息资源出版类型划分)按信息资源出版类型划分 科技图书。科技图书。科技图书是对已有的科学技术成果和实科技图书是对已有的科学技术成果和实践经验比较全面系统地概括和论述。科技图书内容比较践经验比较全面系统地概括和论述。科技图书内容比较成熟,形式相对固定,是积累和传递科学知识的一种传成熟,形式相对固定,是积累和传递科学知识的一种传统的文献方式。国家标准对图书的定义是统的文献方式。国家标准对图书的定义是“以印刷方式以印刷方式单本刊行的出版物单本刊行的出版物”。一般把少于。
21、一般把少于50页的图书称为小册页的图书称为小册子。按其性质可分为阅读性图书子。按其性质可分为阅读性图书(reading book)和参考工和参考工具书具书(reference book)。阅读性图书包括专著、教科书、。阅读性图书包括专著、教科书、论文集、科普读物、技术图书等,它所提供的是系统、论文集、科普读物、技术图书等,它所提供的是系统、完整、总结性的知识信息。参考工具书包括百科全书、完整、总结性的知识信息。参考工具书包括百科全书、词典、年鉴、手册、指南、图册等,它所提供的是各种词典、年鉴、手册、指南、图册等,它所提供的是各种经过验证和浓缩的、离散性的信息。经过验证和浓缩的、离散性的信息。图
22、书的特征:国际标准书号图书的特征:国际标准书号ISBN(International Standard Book Number),13位数,分为位数,分为5段:国际商标码段:国际商标码-地域号地域号-出版社出版社-书号码书号码-计算机效验码,如:计算机效验码,如:978-7-8110-153-9。2011年8月第一章_信息资源检索概述15 科技期刊。科技期刊。科技期刊是指学科范畴属自然科学和科技期刊是指学科范畴属自然科学和技术科学的定期或不定期的连续出版物。期刊技术科学的定期或不定期的连续出版物。期刊(Periodicals)也称杂志也称杂志(Journal,Magazine),有固定统,有固定
23、统一的名称、出版形式和规律,每期发表多个著者的新作。一的名称、出版形式和规律,每期发表多个著者的新作。科技期刊可分为学术性期刊、技术性期刊、科普性期刊、科技期刊可分为学术性期刊、技术性期刊、科普性期刊、政策性期刊及检索性期刊。学术性期刊以发表科研方面政策性期刊及检索性期刊。学术性期刊以发表科研方面的论文为主,具有较强的学术性,是科技期刊的主体;的论文为主,具有较强的学术性,是科技期刊的主体;检索性期刊是提供科技文献线索的主要工具性刊物。检索性期刊是提供科技文献线索的主要工具性刊物。期刊的特征:国际标准刊号期刊的特征:国际标准刊号ISSN(International Series Standar
24、d Number),共,共8位数,分为两段,前位数,分为两段,前7 位数字为刊名代位数字为刊名代号,最后一位为计算机校验码。例如:号,最后一位为计算机校验码。例如:大学图书馆学报大学图书馆学报 1002-1027 西安石油大学学报西安石油大学学报 1001-53612011年8月第一章_信息资源检索概述16 科技报告。科技报告。科技报告是科学研究工作中最终研究科技报告是科学研究工作中最终研究成果报告或阶段性研究成果报告。其内容大多涉及某学成果报告或阶段性研究成果报告。其内容大多涉及某学科前沿技术或高新科技领域的最新研究课题,内容详尽科前沿技术或高新科技领域的最新研究课题,内容详尽系统,一般包括
25、研究过程的原始记录、事实数据、研究系统,一般包括研究过程的原始记录、事实数据、研究方案的选择比较以及成功的经验或失败的原因分析等。方案的选择比较以及成功的经验或失败的原因分析等。每份报告自成一册,发表及时,有较为规范的陈述格式每份报告自成一册,发表及时,有较为规范的陈述格式和统一编号以及来源机构名称等。由于技术保密,使其和统一编号以及来源机构名称等。由于技术保密,使其发行范围和数量受到一定的限制。发行范围和数量受到一定的限制。国际上著名的科技报告是美国政府的四大报告,即政府部门国际上著名的科技报告是美国政府的四大报告,即政府部门的的PB报告、军事系统的报告、军事系统的AD报告、国家航空与宇航局
26、的报告、国家航空与宇航局的NASA报报告和能源部的告和能源部的DOE报告。报告。我国的科技报告是国家科技部出版的我国的科技报告是国家科技部出版的科学技术研究成果报科学技术研究成果报告告,分为,分为“内部内部”、“秘密秘密”、“绝密绝密”3个保密级别,代表个保密级别,代表了我国科学技术发展的最高水平。了我国科学技术发展的最高水平。2011年8月第一章_信息资源检索概述17 会议文献。会议文献。会议文献指在国际、国内学术性或专会议文献指在国际、国内学术性或专业性会议上发表的论文和报告。众多学科的新理论、新业性会议上发表的论文和报告。众多学科的新理论、新技术,大多利用科技会议论文形式首次公布。它往往
27、代技术,大多利用科技会议论文形式首次公布。它往往代表某一领域最新研究成果,学术性较强,能反映世界科表某一领域最新研究成果,学术性较强,能反映世界科技发展水平和趋势。技发展水平和趋势。会议文献分为会前文献和会后文献。会前文献包括会议文献分为会前文献和会后文献。会前文献包括会议日程预告、会议论文预印本和论文文摘等,会后文会议日程预告、会议论文预印本和论文文摘等,会后文献包括会议论文集、会议专刊等。会议文献的著录有其献包括会议论文集、会议专刊等。会议文献的著录有其自身特点,如会议名称、会议时间、会议地点、主办单自身特点,如会议名称、会议时间、会议地点、主办单位等。位等。2011年8月第一章_信息资源
28、检索概述18 专利文献。专利文献。专利文献源于专利制度,是专利文献源于专利制度,是指各国专利局及国际性专利组织的正式出版物,指各国专利局及国际性专利组织的正式出版物,如专利申请说明书、专利说明书、专利公报、专如专利申请说明书、专利说明书、专利公报、专利分类表以及专利文献检索工具等。专利文献是利分类表以及专利文献检索工具等。专利文献是公开通报新发明创造、促进技术发明迅速传播的公开通报新发明创造、促进技术发明迅速传播的媒介。它记录了人类的发明创造,是对技术发明媒介。它记录了人类的发明创造,是对技术发明进行科学审查和实施法律保护的依据。据估计,进行科学审查和实施法律保护的依据。据估计,世界上世界上9
29、0-95%的新技术发明成果首次在专利文的新技术发明成果首次在专利文献中公布,而在其它类型文献中首次公布的只有献中公布,而在其它类型文献中首次公布的只有5-10%。因此,专利文献对应用型科学研究工作。因此,专利文献对应用型科学研究工作者来说是非常重要的信息源。者来说是非常重要的信息源。2011年8月第一章_信息资源检索概述19 学位论文。学位论文。学位论文是为取得博士、硕士、学位论文是为取得博士、硕士、学士学位而撰写的学术性研究论文。学位论文大学士学位而撰写的学术性研究论文。学位论文大体分为两种类型,一是调研综述性论文,著者根体分为两种类型,一是调研综述性论文,著者根据大量的信息和数据进行科学分
30、析研究,对某一据大量的信息和数据进行科学分析研究,对某一问题作出有见解的概括性总结;二是理论研究和问题作出有见解的概括性总结;二是理论研究和探讨性论文,著者在原有论点的基础上根据自己探讨性论文,著者在原有论点的基础上根据自己研究的结果,提出新论点和对新问题的探讨。学研究的结果,提出新论点和对新问题的探讨。学位论文的质量差别很大,但一般都具有一定的深位论文的质量差别很大,但一般都具有一定的深度和独特的见解。度和独特的见解。2011年8月第一章_信息资源检索概述20 标准文献。标准文献。标准文献是经过公认的权威机构批准标准文献是经过公认的权威机构批准的标准化工作成果,是对产品和工程项目的质量、工艺
31、的标准化工作成果,是对产品和工程项目的质量、工艺规范、测试计量方法等方面的技术规定,具有法律约束规范、测试计量方法等方面的技术规定,具有法律约束作用。标准文献反映社会与技术进步以及人类对自然界作用。标准文献反映社会与技术进步以及人类对自然界控制的水平。它是了解各国技术经济政策、技术发展和控制的水平。它是了解各国技术经济政策、技术发展和管理水平的重要参考资料,所包含的技术信息适于直接管理水平的重要参考资料,所包含的技术信息适于直接应用。应用。政府出版物。政府出版物。政府出版物是指各国政府部门及所政府出版物是指各国政府部门及所属专门机构发表和出版的文件。它集中反映了政府各部属专门机构发表和出版的文
32、件。它集中反映了政府各部门对有关工作的观点、法令、方针政策等,通常分为行门对有关工作的观点、法令、方针政策等,通常分为行政性文件和科技文献两大类。政府出版物对了解一个国政性文件和科技文献两大类。政府出版物对了解一个国家科学技术和经济政策及其演变情况,具有一定的参考家科学技术和经济政策及其演变情况,具有一定的参考价值。价值。2011年8月第一章_信息资源检索概述21 产品样本。产品样本。产品样本是企业为推销产品而印发的产品样本是企业为推销产品而印发的商业性技术宣传品。它包括产品说明书、产品目录、厂商业性技术宣传品。它包括产品说明书、产品目录、厂商企业介绍、贸易刊物、产品数据手册等。这类文献内商企
33、业介绍、贸易刊物、产品数据手册等。这类文献内容大多以介绍产品的性能规格、构造原理、用途、使用容大多以介绍产品的性能规格、构造原理、用途、使用方法及规程为主体。其特点是技术成熟可靠、出版迅速、方法及规程为主体。其特点是技术成熟可靠、出版迅速、图文并茂、直观性强。由于产品的更新换代,使产品样图文并茂、直观性强。由于产品的更新换代,使产品样本有效期变短;由于商业宣传成分增多,使其科技信息本有效期变短;由于商业宣传成分增多,使其科技信息含量下降。尽管如此,它仍然是工程技术人员的主要参含量下降。尽管如此,它仍然是工程技术人员的主要参考资料,也是引进国外技术和产品的重要依据。考资料,也是引进国外技术和产品
34、的重要依据。2011年8月第一章_信息资源检索概述22 技术档案。技术档案。技术档案是企事业单位在科研技术档案是企事业单位在科研生产活动中形成并经过特殊整理而转化的具有保生产活动中形成并经过特殊整理而转化的具有保存价值的技术文件。它是科研生产工作中积累经存价值的技术文件。它是科研生产工作中积累经验、提高质量的重要依据,具有重要的信息价值。验、提高质量的重要依据,具有重要的信息价值。以上十种类型的出版物,是科技人员获取信以上十种类型的出版物,是科技人员获取信息的主要来源,我们称为十大信息源。除此之外,息的主要来源,我们称为十大信息源。除此之外,还有报纸、新闻稿件、科技译文、手稿、地图、还有报纸、
35、新闻稿件、科技译文、手稿、地图、科教影片等等,它们都有一些特殊的信息价值。科教影片等等,它们都有一些特殊的信息价值。2011年8月第一章_信息资源检索概述23(3)按加工层次划分)按加工层次划分 一次信息资源。一次信息资源。一次信息的载体形式称为一次信一次信息的载体形式称为一次信息资源,也称原始文献。它是以作者本人的科研工作成息资源,也称原始文献。它是以作者本人的科研工作成果为依据而创作的原始文献,如期刊论文、科技报告、果为依据而创作的原始文献,如期刊论文、科技报告、会议论文、专利文献、学位论文等,它具有新颖性、创会议论文、专利文献、学位论文等,它具有新颖性、创造性和系统性等特征,参考和使用的
36、价值较高。造性和系统性等特征,参考和使用的价值较高。个人专著(某某著书,而某某编的书不是一次文献而是三次个人专著(某某著书,而某某编的书不是一次文献而是三次文献)。文献)。2011年8月第一章_信息资源检索概述24 二次信息资源。二次信息资源。浓缩二次信息的载体形式称为二浓缩二次信息的载体形式称为二次信息资源,是查找一次信息资源的工具。它是将分散次信息资源,是查找一次信息资源的工具。它是将分散的、无序的一次信息资源进行加工整理,使之成为系统的、无序的一次信息资源进行加工整理,使之成为系统有序的信息资源。二次信息资源具有浓缩性、汇集性、有序的信息资源。二次信息资源具有浓缩性、汇集性、有序性等特点
37、,它的作用不仅在于报道信息的内容,更有序性等特点,它的作用不仅在于报道信息的内容,更重要的是可以提供原一次信息资源的线索。重要的是可以提供原一次信息资源的线索。例如:书目、题录、文摘、索引等。例如:书目、题录、文摘、索引等。(图书馆检索室)(图书馆检索室)marc数据数据2011年8月第一章_信息资源检索概述25 三次信息资源。三次信息资源。三次信息的载体形式称为三次信三次信息的载体形式称为三次信息资源,它是指对一次信息资源进行综合分析、研究和息资源,它是指对一次信息资源进行综合分析、研究和评述而编写出来的成果。如手册、百科全书、年鉴以及评述而编写出来的成果。如手册、百科全书、年鉴以及其他综述
38、和评论性文章等。三次信息资源源于一次信息其他综述和评论性文章等。三次信息资源源于一次信息资源,又高于一次信息,是一种再创性文献。资源,又高于一次信息,是一种再创性文献。它可分为两大类:一类是综述、述评等,如各种综它可分为两大类:一类是综述、述评等,如各种综述、动态、进展报告;另一类是参考性工具书,如百科述、动态、进展报告;另一类是参考性工具书,如百科全书、年鉴、手册、词典、文献指南等全书、年鉴、手册、词典、文献指南等2011年8月第一章_信息资源检索概述26 零次信息资源。零次信息资源。零次信息的载体形式称为零次信零次信息的载体形式称为零次信息资源。它是指未经正式出版发行的最原始的记录,如息资
39、源。它是指未经正式出版发行的最原始的记录,如书信、手稿、笔记、实验记录等。其主要特点是内容新书信、手稿、笔记、实验记录等。其主要特点是内容新颖,具有原始性,但不成熟,分散,难于检索。颖,具有原始性,但不成熟,分散,难于检索。如书信、如书信、手稿、笔记、记录等。也有人认为是科技人员口头交谈手稿、笔记、记录等。也有人认为是科技人员口头交谈及直接作用于人的感觉器官的非文献知识,如操作技能、及直接作用于人的感觉器官的非文献知识,如操作技能、诊疗经验等。也可以说,零次文献是以文献所有者本身诊疗经验等。也可以说,零次文献是以文献所有者本身为载体的未公布于世的科技知识。为载体的未公布于世的科技知识。2011
40、年8月第一章_信息资源检索概述27 以上四级信息资源的关系是以上四级信息资源的关系是:零次信息资源是一次信息资源的素材;零次信息资源是一次信息资源的素材;一次信息资源是二次、三次信息资源的来源一次信息资源是二次、三次信息资源的来源和基础;和基础;二次、三次信息资源是对一次信息资源进行二次、三次信息资源是对一次信息资源进行组织、加工、综合后形成的,它们编写的目的明组织、加工、综合后形成的,它们编写的目的明确,专指性强。确,专指性强。2011年8月第一章_信息资源检索概述28(4)实物信息资源)实物信息资源 实物信息资源是指以实物为载体的信息资源。实物信息资源是指以实物为载体的信息资源。依据实物的
41、人工与天然特性又可将实物信息资源依据实物的人工与天然特性又可将实物信息资源分为以自然物质为载体的天然实物信息资源和以分为以自然物质为载体的天然实物信息资源和以人工实物为载体的人工实物信息资源(如产品、人工实物为载体的人工实物信息资源(如产品、样品、样机、模型、雕塑等)。样品、样机、模型、雕塑等)。2011年8月第一章_信息资源检索概述29(5)网络信息资源)网络信息资源 网络信息资源是指从计算机、通信技术、多媒体技网络信息资源是指从计算机、通信技术、多媒体技术相互融合而形成的网络上可查找到的资源。网上可利术相互融合而形成的网络上可查找到的资源。网上可利用的信息资源是多种多样的,从网络信息管理和
42、利用的用的信息资源是多种多样的,从网络信息管理和利用的角度出发,人们对已存在于网络中的信息资源进行了类角度出发,人们对已存在于网络中的信息资源进行了类型化和系统化研究,不同的角度有不同的分类形式,一型化和系统化研究,不同的角度有不同的分类形式,一般有以下几种:般有以下几种:按信息表现形式分有电子出版物和非电子出版物按信息表现形式分有电子出版物和非电子出版物信息资源。信息资源。按信息的媒体形式分本为文本信息资源、超文本按信息的媒体形式分本为文本信息资源、超文本信息资源、多媒体信息资源和超媒体信息资源。信息资源、多媒体信息资源和超媒体信息资源。2011年8月第一章_信息资源检索概述30 文本信息资
43、源。文本信息资源。普通的文本信息资源的知识单元按线普通的文本信息资源的知识单元按线性排列。性排列。超文本信息资源。超文本信息资源。超文本信息资源是按知识单元及其超文本信息资源是按知识单元及其关系建立的知识结构网络。它的本质和基本特征就是在关系建立的知识结构网络。它的本质和基本特征就是在文档内部和文档之间建立联系,这种关系给了文本以非文档内部和文档之间建立联系,这种关系给了文本以非线性的组织。简言之,超文本是由存放信息的结点和描线性的组织。简言之,超文本是由存放信息的结点和描述信息之间关系的链组成的。结点是超文本系统中的自述信息之间关系的链组成的。结点是超文本系统中的自然数据单元,结点可大可小,
44、规模不同,类型不同。链然数据单元,结点可大可小,规模不同,类型不同。链是超文本系统中表现信息之间关系的实体,它陷藏在信是超文本系统中表现信息之间关系的实体,它陷藏在信息背后。用户通过链接浏览信息内容时,往往意识不到息背后。用户通过链接浏览信息内容时,往往意识不到是在分布式的计算机上从一个结点跳到另外一个结点。是在分布式的计算机上从一个结点跳到另外一个结点。只有链的存在,才能在信息单元之间建立联系,才有了只有链的存在,才能在信息单元之间建立联系,才有了非线性的信息组织方式。非线性的信息组织方式。2011年8月第一章_信息资源检索概述31 多媒体信息资源。多媒体信息资源。多媒体是包括文体、图像和声
45、音在内的各种多媒体是包括文体、图像和声音在内的各种信息表达和传播形式的总称。由于计算机软、硬件的技术限制,相信息表达和传播形式的总称。由于计算机软、硬件的技术限制,相当长时间以来,计算机信息检索系统只限于存储和检索书目、文摘当长时间以来,计算机信息检索系统只限于存储和检索书目、文摘等二次文献型文献,多媒体技术的出现和使用使得人们接受信息资等二次文献型文献,多媒体技术的出现和使用使得人们接受信息资源的范围扩大到事实型数据库,如图谱、切片、三维结构等。源的范围扩大到事实型数据库,如图谱、切片、三维结构等。超媒体信息资源。超媒体信息资源。超媒体是超文本与多媒体两种技术的结合。超媒体是超文本与多媒体两
46、种技术的结合。一般说来,当超文本结点中的信息是多媒体信息时,就称为超媒体,一般说来,当超文本结点中的信息是多媒体信息时,就称为超媒体,它是超级媒体的简称。意即在主页中包含大量多媒体的超级链接,它是超级媒体的简称。意即在主页中包含大量多媒体的超级链接,除了图像、动画、声音外,还可以包括表格、表单等形式。近年来,除了图像、动画、声音外,还可以包括表格、表单等形式。近年来,超媒体技术发展迅速,在网络上,超媒体应用系统不断涌现。在超超媒体技术发展迅速,在网络上,超媒体应用系统不断涌现。在超媒体信息系统中,不同类型的媒体信息能高度综合和集成,空间上媒体信息系统中,不同类型的媒体信息能高度综合和集成,空间
47、上图文并茂,时间上媒体信息同步实现有超文本和多媒体两种信息资图文并茂,时间上媒体信息同步实现有超文本和多媒体两种信息资源的特点,具有高度的交互性。例如,流媒体就是这种超媒体信息源的特点,具有高度的交互性。例如,流媒体就是这种超媒体信息资源的一种切实有效的传递方式。资源的一种切实有效的传递方式。2011年8月第一章_信息资源检索概述32 按网络信息资源加工层次,可以分为网络资源指按网络信息资源加工层次,可以分为网络资源指南和搜索引擎,联机馆藏目录、数据库信息资源、电子南和搜索引擎,联机馆藏目录、数据库信息资源、电子出版物、网上参考工具和其它动态信息。出版物、网上参考工具和其它动态信息。按照用户采
48、用的不同的网络协议来划分,可以分按照用户采用的不同的网络协议来划分,可以分为基于超文本传输协议(为基于超文本传输协议(HTTP)的信息资源、基于文件)的信息资源、基于文件传输协议(传输协议(FTP)的信息资源、基于远程登录)的信息资源、基于远程登录(TELNET)的信息资源、新闻组)的信息资源、新闻组(Usenet/Newsgroups)资源和电子邮件()资源和电子邮件(E-mail)信)信息资源。息资源。此外随着此外随着web2.0的发展信息资源也便及整个的发展信息资源也便及整个web2.0中,如博客,百科,维基,播客等等。中,如博客,百科,维基,播客等等。2011年8月第一章_信息资源检索
49、概述33第二节信息资源的检索2.1信息资源检索信息资源检索 信息资源检索是从信息资源集合中找出所需信息内容的过程。信息资源检索是从信息资源集合中找出所需信息内容的过程。从广义上讲,信息资源检索包括两个过程,一是信息资源的存从广义上讲,信息资源检索包括两个过程,一是信息资源的存储(储(Information Storage),所谓存储是对有关信息进行选择,并),所谓存储是对有关信息进行选择,并对信息特征进行著录、标引和组织,建立信息数据库的过程;二是对信息特征进行著录、标引和组织,建立信息数据库的过程;二是信息资源的检索(信息资源的检索(Information Retrieval),所谓检索是根
50、据检索提),所谓检索是根据检索提问制定检索策略,利用信息数据库查找信息资源的过程。问制定检索策略,利用信息数据库查找信息资源的过程。从狭义上讲,信息资源检索仅指后一部分。信息资源的检索本质从狭义上讲,信息资源检索仅指后一部分。信息资源的检索本质是一个匹配的过程,即信息用户的需求和一定的信息集合的比较和是一个匹配的过程,即信息用户的需求和一定的信息集合的比较和选择的过程。换言之,也就是用户根据自己的需求提出的主题概念选择的过程。换言之,也就是用户根据自己的需求提出的主题概念或提问表达式与一定的信息资源系统的检索语言相适应的过程,如或提问表达式与一定的信息资源系统的检索语言相适应的过程,如果两者相