《信息检索复习提纲一.pdf》由会员分享,可在线阅读,更多相关《信息检索复习提纲一.pdf(6页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、信息检索复习提纲 第一章 信息检索的基础知识 1.1 信息检索的基本概念 一、基本概念 1、信息:物质存在方式和运动状态的反应,在发生源和吸收源之间,当发生源发出的信号被吸收源所理解,信号就成为信息。2、文献:大凡人类的知识用文字、图形、符号、声频、视频的手段记录下来的东西,统统可称为文献。也可以称为固化在一定载体上的知识。3、资料:固化在一定的实物或载体上的知识。二、信息的传递渠道:非正式传递渠道和正式传递渠道(非正式过程、正式过程)(1)非正式过程 a、科学技术工作者之间就他们从事的研究和研制进行直接对话,如交谈、参加学术会议等;b、科技工作者参观同行的实验室、科学展览等等;c、科技工作者
2、对某些工众作口头演讲;d、交换书信、出版物欲印本和单行本;e、研究或研制成果在发表前的准备工作,包括发表形式以及发表的地点和时间的选择。(2)正式过程 a、为手稿的发表所作的编辑出版和印刷过程,包括写书评;b、科学出版物的发行过程,包括与发行过程有关的书刊商业活动;c、图书馆的书目工作和检索工作;d、信息工作本身,从搜集到检索,包括宣传工作。三、信息检索(P2-4)(一)信息检索:就是从大量的文献中查寻与信息提问所指定的课题(对象)有关的文献,或者是包含用户所需事实与消息的文献的过程。它包括三个方面:数据检索、事实检索、文献检索 数据检索、事实检索、文献检索三者中以文献检索为主。数据和事实检索
3、是检索出包含在文献中的具体情报;文献检索则是要检索出包含所需要情报的文献。四、文献检索及其类型(1)定义:1、检索系统的建立及检索工具的组织和积累 2、文献的查寻,利用检索工具检出与课题相关的文献。(2)文献检索的类型 1、直接检索:是从通过阅读原始文献直接获取所需信息。(快捷、方便 漏查率高)a、直接检索原文易于掌握文献的实质内容,可直接判断其信息内容是否符合信息要求,并可能得到意外的收获;b、直接检索简便易行,并且时效高。2、间接检索:是通过检索工具的指导再查找原始文献而获取所需信息。(系统、全面但滞后)a、使盲目的分散检索成为有目的的集中检索;b、文献质量有较好的保证;c、加速了检索过程
4、;d、消除语言障碍;e、提供了广泛的信息来源;f、提供了有规律的检索途径。1.2 信息的类型及特点(P4-7)一、从不同的角度信息可以分为不同的类型 1、加工层次(请注意这三者的不同与联系)(P4 表格)(1)一次信息(原始文献)(2)二次信息(检索工具)(3)三次信息(参考工具)2、信息载体的出版编辑特点 期刊、图书、会议文献、专利文献、学位论文、政府出版物、标准文献、产品资料、技术档案、报纸、新闻稿、工作文稿(从基本概念、内容特点、著录特点三个方面着重掌握图书、期刊、会议、专利、标准、学位六种文献类型 P5-6 表格)3、物理类型印刷型、缩微型、机读型、声像型(1)印刷型 优点:便于阅读,
5、传递,不受时间、地点的限制,不需任何阅读设备;缺点:贮存密度低,收藏管理要占用较大的空间和较多人力。(2)缩微型 优点:节省空间、价格便宜、易于管理 缺点:必须借助于阅读机,不能同时利用几种文献,因而利用不便。(3)电子型 优点:贮存信息量大,并能按一定的程序设计快速输出文献单元及知识单元 缺点:人不恩那个直接阅读,必须借助于计算机。(4)声像型 优点:给人以直观的感觉、快速传递科学信息 缺点:需要相应的设备条件 4、按信息的性质划分:自然信息、社会信息 5、按信息所表征的服务对象划分:经济信息、科技信息、教育信息、军事信息、商业信息、金融信息、综合信息 13 检索工具及索引语言(P8-11)
6、一、文献检索工具的概况和分类(一)基本概念:按一定的学科、主题等进行搜集整理并给予文献的标志,是及时报道的二次文献,具有报道、存贮、检索的功能。(二)检索工具必须具备下列四项条件:(1)对所收录的文献的各种特征(包括外部特征和内容特征)要有详细的描述;(2)每条描述记录(即款目)都标明有可供检索的标识;(3)全部描述记录科学的组织成一个有机的整体;(4)具有多种必要的检索手段 (1)条件-报道和存储功能,(2)、(3)、(4)条件-检索功能 *注意文献的外部特征和内容特征分别指什么?(三)基本类型:1、按检索方法划分(手工型 机械型)2、按收录的学科范围分(综合型 专业型)3、按收录的文献类型
7、的出版形式分(全面型 单一型)4、按著录形式分(著录对象 著录内容 主要类型)(P8-9 表格)类型 著录对象 著录内容 主要类型 代表 目录 单位出版物 书名、刊名、著者、出版项等 书本式 馆藏目录联合目录 题录 单篇文献 著者、篇名、出处等 卡片式 全国报刊索引 文摘 单篇文献 著者、篇名、出处、摘要 报道型 指示型 化学文摘工程索引 索引 单位出版物 文献中的各知识单元 书名索引 主题索引 一般不独立成册,附在检索工单篇文献 作者索引 分类索引等 具、参考工具、书刊之后 二、文献检索工具的一般结构 1、使用说明:为使用者提供必要的指导 2、目次表:为使用者提供分类途径的检索。3、正文:检
8、索工具的主体。4、辅助索引:为用户提供多种途径的检索,从而提高检索效率。5、附表:是检索工具内容的必要补充。三、网络型检索工具(一)根据网络检索工具特点划分 1、字典型检索工具:它用于查询网上用户名、Email、URL(统一资源定位器)、服务器地址 2、索引型检索工具:为 网上信息资源建立索引 3、交互式检索工具:提供类似商用联机检索的网络信息查询服务 (二)根据网络检索工具检索结果分 1、文献型检索工具(依文献加工的深度又可以分为:目录数据库型检索工具;题录、文摘数据库型检索工具;全文数据库型检索工具;引文索引数据库型检索工具 2、数值型检索工具 3、事实型检索工具(存储的是经过加工的三次文
9、献的信息)四、搜索引擎(狭义上由搜索软件、索引数据库和检索软件三部分组成,它们是决定搜索引擎特性的最重要的三个方面)(一)搜索引擎的检索技巧 a、熟悉经常使用的检索工具及其特性是搜索成功的基础 b、关键词的选择是运用搜索引擎成功的重要因素 选择合适的关键词要从以下几点去考虑:c、检索时使用检索人员所用的关键词的同义词;d、利用关键词的地区性来考虑检索;e、使用更长的关键词来检索;f、关键词的组合检索(二)搜索引擎的服务类型 1、检索方式划分:关键词检索、分类检索 2、检索对象的不同:Web检索、新闻组检索;黄页服务、白页服务;特殊搜索服务 3、检索范围的不同:全球性检索、地区性检索(三)搜索引
10、擎的工作原理 1、搜索引擎的基本模式:运行特定的网络搜索程序,定期搜索因特网的各个站点。结果送回到的文献信息(包括 Web页面和新闻组文章等)。索引软件对这些文献进行自动标引,加入集中管理的索引数据库。然后 Web站点上提供检索界面,由用户输入提问检索式,通过特定的检索软件,查找其检索数据库,给出与检索式相匹配的查询结果,供用户浏览。五、索引语言(P1420)按其结构原理划分:分类语言(体系分类法、组配分类法)、描述语言(标题法、单元词法、叙词法、关键词法)、代码语言 1.4 检索程序及获取原文 一、检索步骤(一)分析检索课题 1、首先要分析检索课题的主要内容 2、确定所需信息类型 3、确定检
11、索的时间范围 4、分析已知信息(二)选择检索方法 1、手工检索方法主要有三种:A、常用法:顺查法、倒查法、抽查法 要求查全,则用顺查法;要求快、新,则用倒查法;掌握了课题的发展阶段特点,则用抽查法。B、追溯法(以文章末尾所附的“参考文献”为线索,进行逐一追踪检索的方法)C、综合法(分段法)(三)选定检索工具(四)确定检索途径(主题途径、分类途径、著者途径、序号途径、书名途径)通常检索的课题专指性较强,所需的内容比较专、深,要求特性检索,选用主题途径为好;检索的课题泛指型较强,所需的内容范围较广,要求族性检索,选用分类途径较好。(五)查找文献线索 二、获取原文 1、获取一次信息的方法有:a、从本
12、单位图书信息部门获取 b、从国内其他图书信息机构,由近及远的获取 c、给著者写信获取 d、从文摘、索引等检索工具出版机构获取 e、网络获取 2、图书、期刊、会议文献、标准文献、专利文献、馆藏目录与联合目录信息类型识别及网络上直接检索获取原文的方法 P2325 1.5 检索效率分析和检索策略探讨 衡量检索效率有两个指标:查全率、查准率 查全率=(被检索出的相关文献的数量/总文献中所有相关文献的数量)X 100%查准率=(被检索出的相关文献的数量/被检索出文献的总数量)X 100%(1)如何提高查全率 1、少用逻辑“与”(AND)组配 2、多用逻辑“或”(OR)组配 3、用比较宽泛的检索项 4、上位词检索 5、同义词检索 6、截词检索(模糊匹配)(2)如何提高查准率 1、用精确匹配 2、提高检索词的专指度 3、利用逻辑“非”剔除 4、利用文献外表特征限制