《基础知识信息检索策略与信息需求分析.ppt》由会员分享,可在线阅读,更多相关《基础知识信息检索策略与信息需求分析.ppt(59页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第五讲:基础知识信息检索策略与信息需求分析 王建涛1下次课内容是网络检索,做个小调查,请配合v填写页面:你为什么上网?或说你上网都做些什么?能具体列举吗?你认为网络上都有什么,能具体列举吗?你上网的时候,觉得最困难或最困惑的是什么?其它你想对老师说的(如期待网络检索课程内容有什么等)。2第三讲回顾:小结NO6v 文献信息分类特点 方便文献信息的排架,便于索取;类目的结构严谨,逻辑性强;适合学术信息资源的组织。v 网络信息分类特点 根据网络信息的存在状况和当前上网用户的特点来编制的,科学性、系统性稍差;适合大众信息资源的组织。v 数据库信息分类特点 结合文献信息分类和网络信息分类的优点 方便浏览
2、和检索3第三讲回顾:小结NO7分类语言 主题语言以学科和专业集中文献 能将不同不同学科的信息集中到一起适宜族性检索 适宜特性检索不利于新兴学科、交叉学科和边缘学科的检索不利于新兴学科检索查全率不高 查准率不高4第三讲回顾:小结NO8v 计算机信息检索技术是用户信息需求和文献信息集合之间的匹配比较技术。v v布尔逻辑检索布尔逻辑检索、截词检索截词检索、邻近检索邻近检索、短语检短语检索索、字段检索字段检索v v网络信息检索网络信息检索v 几乎所有的检索系统都有布尔逻辑检索、截词检索(模糊检索)和限制检索,而不同的检索系统又会有一些特殊的检索技术和功能。5第三讲作业讲评v信息检索技术6什么是信息检索
3、策略?v执行一个课题的检索是有过程、分步来完成的,检索步骤的科学安排称为检索策略(retrieval strategy),它是为实现检索目标而制定的全盘计划或方案。特别是在计算机检索中,策略问题是明确提出来的,必须慎重考虑,因为它可能要完成的是一个比较复杂、精细的检索课题,又是在人与机器的对话、交互中实现的。7为什么不自己拟定一个检索课题?v请根据你自己的兴趣或正在学习的课程相关内容拟定一个检索课题,后面课程的实践将以你拟定的检索课题进行。有可能实践考试是自拟课题进行检索。v你可以参考课程页面上给出的“选题参考”拟定自己的检索课题。8回忆“信息检索步骤”分析检索课题,明确信息需求 选择检索工具
4、,了解检索系统 确定检索途经,选定检索方法 实施检索策略,浏览初步结果 调整检索策略,获取所需信息9准则一v你得到什么检索结果,取决于你怎么提问七条信息检索准则来自:101 分析检索课题,明确信息需求v v 检索需求类型 检索需求类型v v 主题概念分析 主题概念分析(注:是课题检索的重点和难点)v 检索目的(申报课题、开题报告、学术论文、成果查新、课程论文、商业需求以及其它需求类型等)v 文献类型(期刊论文、会议论文、科技报告、图书、专利、标准、网站等)v 结果形式(全文、文摘、题录、数值、事实等)v 检索年限(如2000年以来的文献)v 语种(中文、外文;英文、日文)v 检索结果数量(10
5、0?50?)111.1 检索需求类型查找某概念的确切含义 如:什么是“blog”查找某概念的背景知识 如:谁最先发现青霉素查找某些事物的数值及量化指标 特征型知识:特征型知识:一般通过事实型、数值型数据库和搜索引擎获得。12查找某一学科的一般知识 如:关于分子生物学有哪些专著查找学科专业领域的新进展 如:有关纳米技术的研究综述查找课题相关的专业文献 最常见的!关联型知识:关联型知识:文献数据库13更多实例:v 电子元器件的技术特性数据,可用有关的电子元器件类手册、产品目录、样本或书查找;v 查过去某年度某种电气电子类产品的产销、贸易、市场概况,可用有关年鉴类资料;v 查国内外哪些大学招收电气电
6、子类研究生,可查大学类的机构名录或校方的招生简章资料;v 查“自动化”一词的概念与含义,可用百科全书、学科术语类解释辞典和相关手册;v 查电子产品的电路图,可用相应的电路图集或手册;v 查钱学森的主要论著和贡献,可用名人录;等等。141.2 主题概念分析从熟悉的已知文献信息入手v 分析检索课题的内容实质v 找出隐性的主题概念并将抽象的主题概念转化为具体的概念v 找出核心概念,排除无关概念和重复概念,简化逻辑关系v 明确概念间的逻辑关系来源:龚国伟.分析检索课题的方法与技巧研究.图书馆工作与研究.2006/04 151.2.1 分析检索课题的内容实质v从镀锌残渣中回收锌 工艺?实际是:从高品位镀
7、锌残渣中分离铁 所以课题可以这样表述:“从锌块中分离铁”161.2.2 隐性主题的处理-主题概念具体化v请分析主题概念。“耐热钢”课题:高温下使用的不锈钢“不锈钢”17隐性主题具体化如:酸洗费液的处理处理:“回收”、“再生”如:煤灰利用具体利用:?检索式:(粉煤灰+煤炭)*(利用+砖+水泥+混凝土+路基+)18找出核心概念,简化逻辑关系v并不是概念越多越好!v抓住主题的核心:最能表达检索课题内容,而且具有实际检索意义的关键词。v如“利用稻米皮糠提取天然食品色素”稻米、皮糠、提取、天然、食品、色素 稻米、色素19排除检索意义不大的词v排除检索意义不大而且比较泛指的概念 如:展望、发展趋势、现状、
8、近况、生产工艺、应用、利用、作用、方法、影响、制备、结果v不要望词生义201.2.4 明确概念间的逻辑关系v同义词、近义词是或的关系v上位词 即扩检,如“教育心理学”v下位词 即缩检,如“智育心理”、“德育心理”、“美育心理”、“教学心理学”、“学习心理学”、“教师心理学”、“学生心理学”等。若多个下位词都用来检索,相对于一个上位词来说,一般是扩检。一个下位词相对于一个上位词来说,一般是缩检。211.2.5 如何选词v 表示具体事物名称的名词术语,如汽车、变压器、反应堆、水稻、坐标仪等;v 表示事物的状态或现象的名词术语,如强度、失真、土壤熟化、日冕、船舶过载等;v 表示科学分类的名词术语,如
9、数学、物理学、中医学、电子学、建筑工程、水利工程等;v 表示研究方法、技术方法的名词术语,如分析(化学)、针刺手法、有限元法、结构功能法、力学性能试验等;本页面内容参考汉语主题词表22v 表示工艺方法、加工技术的名词术语,如铸造、锻造、热处理、焊接、酿造、取心钻进、爆破成型、激光切割等;v 表示化学元素、化合物、金属材料与合金的名词术语,如钠、氧原子、族元素、钠化合物、硅化物、硫酸、钛络合物、钉胺、呋喃、吡啶、醇聚四氟乙烯、丁二酸()以及如金属板耐蚀钢、耐蚀合金等;v 表示国家名称、地名、组织机构名称及人名的专有名词以及文献类型、文献载体的名词术语,23信息检索的一般步骤1.分析检索课题,明确
10、信息需求2.2.选择检索工具,了解检索系统3.确定检索途经,选定检索方法4.实施检索策略,浏览初步结果5.调整检索策略,获取所需信息24准则二:v去信息应该在的地方检索 252.选择检索工具,了解检索系统v与检索主题相关的检索工具有哪些?*(主要看数据库的学科覆盖范围)v与检索需求的文献类型相关的检索工具有哪些?(如:哪些数据库或网站中含有会议论文)v语种、年限、结果形式(全文还是文摘)(如检索19891994年的文献,选择维普还是CNKI)26回顾:信息检索工具272.1 选择检索工具的一般方法v根据不同的文献类型和语种需求选择v根据利用方便、使用熟练的程度选择v根据相应速度、获得支持和帮助
11、的程度选择v根据数据量、信息年限的需求选择v根据经验和推荐选择282.2 选择的前提:知道有哪些信息源v 图书馆网站的书目v 数字资源列表(数据库)v 搜索引擎如:谷歌图书搜索、百度图书搜索、谷歌学术搜索、谷歌专利搜索等v 网络目录 http:/提供公共信息的专门网站,如标准v 开放获取信息资源,如ArXiv预印本文献库 292.3 宏观上:“如何了解一个数据库”v 国际国内的在学术等领域的影响或地位v 服务形式(WEB、光盘、联机检索、单机)校内、国内、国外。镜像v 涵盖学科或主题范围v 文献类型(出版形式、内容层次)v 收录年限,收录对象v 数据量(记录数)v 文种v 更新频率v 访问模式
12、(口令,IP控制)v 其它信息:帮助信息、出版者、发行者、在同行中的地位。30如何了解一个数据库样例:书生数字图书v 国内重要的数字图书之一v 服务形式:WEB/镜像v 涵盖学科或主题范围:所有学科v 文献类型(出版形式、内容层次等):电子图书,全文(一次文献)v 收录年限,收录对象:20012003,纸本图书的数字化v 数据量(记录数):11.4万v 文种:中文v 更新频率:年v 访问模式:IP控制312.4 微观上:“如何检索一个特定的数据库”v 宏观上了解数据库,熟悉界面。v 利用数据库提供的检索指南(帮助、FAQ)。v 了解检索与浏览模式(一般检索、高级检索、分类检索、特色检索等;按主
13、题浏览、按出版物字顺浏览等)。v 检索结果的获得(多种全文格式、题录信息保存、提供预印本)v 其它特色功能(检索策略保存、信息定制)v 全文阅读工具(PDF、专用阅读器)322.4 如何获得数据库的检索帮助与指南信息v一般数据库界面上都有“帮助”或者“检索指南”。v图书馆等文献机构发布数据库时提供的使用帮助。v通过Google等搜索引擎搜索。如:filetype:ppt 中国期刊全文数据库33信息检索的一般步骤1.分析检索课题,明确信息需求2.选择检索工具,了解检索系统3.3.确定检索途经,选定检索方法4.实施检索策略,浏览初步结果5.调整检索策略,获取所需信息343.确定检索途经,选定检索方
14、法v有什么样的检索标识或检索语言,就有什么样的检索途经(检索标识:题名、主题或关键词、摘要、全文、作者、机构、分类、出版物名等)35回顾:信息检索方法363.1 间接检索法(即检索方法)v 间接检索法是借助于检索工具查获所需文献的方法,包括顺查法、倒查法和抽查法。顺查法 是经过分析,确定查找的起始年代,再利用选定的检索工具由远及近地逐年查找文献的方法。它适用普查一定时间的全部文献,查全率较高,并能掌握课题的来龙去脉,了解其研究历史、研究现状和发展趋势。倒查法 此法与顺查法相反,是按照时间范围,利用选定的检索工具由近及远地逐年查找,直到查到所需文献为止。由于这种方法重点是查检近期文献,所以能获得
15、较新的文献信息,节省检索时间。然而不如顺查法查全率高,容易产生漏检的现象。37v是根据检索需求,针对所属学科处于发展兴旺时期的若干年进行文献查找。v用这种方法能获得一批具有代表性、反映学科发展水平的文献,检索效果和效率较高,但必须熟悉学科发展的特点。抽查法38追溯检索法v 也叫扩展法、追踪法。此法不是利用确定的检索工具,而是利用已知文献的某种指引,如文献附的参考文献、有关注释、辅助索引、附录等,追踪查找文献。v 根据已知文献的指引,查找到一批相关文献;再根据相关文献的有关指引,扩大并发现新的线索,去进一步查找。如此反复追踪扩展下去,直到检索到切题的文献。v 用追溯法检索文献,最好利用与研究课题
16、相关的专著与综述,因为它们所附的参考资料既多且精。v 在检索工具不全、文献线索很少的情况下,可采用此法。39追溯检索的更多应用v文章参考文献更多文章v文章作者文章v作者文章v作者团体更多作者文章v链接网站更多链接v期刊论文图书v图书期刊论文40追溯检索的作用v用较少的文献引出较多的文献v了解科学研究的前期工作基础、相关文献、经典著作、主要作者、重点期刊等。413.2 直接检索法v 是指直接通过浏览、查阅文献原文而获取所需文献信息的方法。这种方法不依靠检索工具,所以不是严格意义上的检索方法 优点:能够明确判断文献所包含的信息是否需要 缺点:是难以获得全面的文献,且费时费力,具有一定的盲目性和偶然
17、性。如果检索课题单一,文献相对集中,又熟悉检索书刊,可用这种检索方法。对于有多个主题、文献离散度较大的课题,则不宜用此法 由于直接检索具有准确性和实用性优势,能满足用户直接获取文献的要求,因而是文献检索的必要手段。423.3 文献信息老化规律的应用 随着时间的推移,信息的价值会逐渐衰减乃至失效。文献信息表现出老化规律。文献信息老化的情形有:l 所含信息仍有用,但现在已经被包含在其它更新的文献中。l 所含信息仍有用,但现在正处于人们对其兴趣下降的阶段。l 所含信息仍有用,但为后来的文献所超越。l 所含信息不再有用。文献的半衰期:某学科领域现时还在利用的全部文献中的一半是在多长的时间内发表的。例如
18、:物理学文献的半率期是4.6年,即是说:现时仍在利用的物理学文献的50,其出版年龄不超过4.6年。半衰期与文献的增长、学科差异、学科发展的阶段和信息环境与需求有关。43老化规律应用-限定年限的检索方法v 在进行文献信息检索时,注意文献出版年的限定。学术信息的半衰期一般是35年。许多信息的老化如艺术品、经济信息、市场信息等表现出跳跃性。有时突然失效,有时永不失效。v 查阅文献信息时尽量选取较新的文献。同时要顾及较早的文献。一般性研究可选择近5年来的文献即可。了解背景资料的则要长得多。v 对发达国家的文献的利用可以在中文文献年限的基础上增加310年。44信息检索的一般步骤1.分析检索课题,明确信息
19、需求2.选择检索工具,了解检索系统3.确定检索途经,选定检索方法4.4.实施检索策略,浏览初步结果5.调整检索策略,获取所需信息45准则三v向你的检索结果提问 信息可能是真的,但内容仍然会有错的464.实施检索策略,浏览初步结果v在课题检索需求分析和了解检索系统的基础上,应用检索技术具体去检索!注意逻辑组配、限定。v检索结果的选择与判断注意排序和输出结果的设定v注意下载相关全文阅读器47检索结果内容的判断v看检索结果记录的标题和摘要是否为课题检索需要v注意根据信息来源判断信息的价值v看结果数量(太多或太少都不合适)v适当利用关联检索和类别检索功能扩展检索领域和范围根据以上对检索结果内容的判断,
20、调整检索策略48信息检索的一般步骤1.分析检索课题,明确信息需求2.选择检索工具,了解检索系统3.确定检索途经,选定检索方法4.实施检索策略,浏览初步结果5.5.调整检索策略,获取所需信息49准则四:v检索是一个多步骤的过程505.调整检索策略,获取所需信息v根据初步检索结果判断,调整检索策略(检索需求;检索途径;检索方法;扩展检索、限定检索等)515.1 扩展检索的方法v用上位词v用同义词v用多种写法v用ORv检索系统的关联检索、相关关键词检索、引文检索等等525.2 缩检的方法v用下位词v用专指的词v单元词合并为词组,如“互联网、使用、状况”合并为一个词组“互联网使用状况”,v精确检索v用
21、AND 和NOTv各种限度检索53准则五v 检索结果必须符合需求54挑选检索结果,获取所需信息v下载全文;v保存题录文摘;v文献传递与馆际互借;v信息格式的转换等55什么是“合理使用”v“合理使用”是指在一定情况下使用他人已经发表的作品,可以不经著作权人同意,不向其支付报酬。但是应当指明作者的姓名、作品名称,并不得侵犯著作权人享有的其他权利。v 合理使用是一种制作未经授权的复制品,以用作一定的保护性的目的的权利。主要包括学术上的使用、教育、写报道、或者写评论。但是这也有一些限定条件,就是所使用的部分相对于该作品的总篇幅来说较短,而且不会有损于该作品的拥有人的经济利益。v 网络信息资源合理使用范
22、例:56准则六v咨询图书馆员57准则七v信息本身是无意义的,只有人提问之后才有价值(你要信息干什么,如何利用这些信息,如何整合这些信息,如何从信息到知识到情报)58第五讲作业:课题分析v 自选课题或从课程页面“参考选题”中选择一个课题,并做课题分析(建议先找到一些文献信息,深入了解课题需求)。v 请到“作业专用提交页面”:http:/=2410 提交内容统一格式如下:提交内容统一格式如下:如:2班,王建涛:课题分析作业课题名称:开放目录在图书馆中的应用研究课题说明:本课题是利用开放目录“网聚人力”的思想和开放管理的技术,将信息需求者和信息建设者的身份进行统一,实现信息资源的发现、组织、管理和服务。本课题研究目的是构建融合图书馆功能的开放目录框架、质量体系和网站系统,强调学术信息资源(此处省略,你可不要省略)。检索词:开放目录,学科门户,信息资源组织,信息服务、网络人力资源(此处省略,你可不要省略)。59