《文献检索课复习材料.pdf》由会员分享,可在线阅读,更多相关《文献检索课复习材料.pdf(4页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、 文献检索课复习材料 第一章 1.信息的概念:信息是自然界、人类社会以及思维活动中普遍存在的现象,是一切事物自身存在方式以及它们之间相互关系、相互作用等运动状态的表达。2.信息按照出版形式和内容的不同,可分为图书、期刊、报纸、和特种信息。特种信息包括:学位论文、专利信息、标准信息、会议信息、科技报告、政府出版物、产品样本资料和档案。3.文献的概念:记录有知识的一切载体。是以文字、图像、符号、声频、视频等作为记录手段,将信息记录或描述在一定的物质载体上,有其特定的表现形式,能起到存贮和传播信息情报与知识作用的载体。文献的四个要素:1.知识和信息内容:文献存在之理由;2.记录载体:承载知识信息的物
2、质实体;3.记录符号:知识信息内容的表达手段;4.记录方式:将符号所代表的知识信息内容存储在载体材料上。4.图书的标识:ISBN(国际标准书号),图书的形式特征:在参考文献列表里,图书的著录格式一般依次是作者、书名、出版地点、出版社、出版时间。还有版本号和国际标准书号。图书的内容特征:图书的内容全面系统,基础理论性强,论点成熟可靠。如果需要对大范围问题获得一般知识,对陌生问题进行一般了解,对熟悉问题进行历史性的全面系统的回顾,查阅图书一般来说是行之有效的办法。当图书的撰写、编辑、出版所需要的时间较长,传递信息速度慢,内容相对陈旧。5.期刊:一种以印刷形式或其他形式逐次刊行的,通常有数字或年月顺
3、序编号,并打算无限期地连续出版下去的出版物。期刊的标准:ISSN(国际标准刊号),CN 号(国内标准刊号)。期刊的内容特征:内容新颖,能及时反映最新研究成果和动态;信息量大,发行与流通面广,便于获取;按期连续出版,便于研究者长期跟踪研究。期刊的类型:(1)按使用范围划分:我过标准分为国家标准、行业标准、地方标准、企业标准四级。“GB”表示强制性国家标准,是具有法律属性,在一定范围内通过法律、行政法规等手段强制执行的标准。“GB/T”表示国家推荐行标准。(2)按照内容特点,标准还可以划分为:a:方法标准,包括:实验方法、检查方法、分析方法、测定方法、抽样方法、设计规范、计算方法、工艺规程、作业指
4、导书、生产方法、操作方法及包装、运输方法等。b:术语标准,以各种专业术语为对象所制定的标准,成为术语标准。术语标准中一般规定术语、定义(或解释行说明)和对应的外文名称。6.信息检索的概念:狭义的检索是指依据一定的方法,从已经组织好的大量有关文献信息集合中,查找并获取特定的相关文献信息的过程;广义的检索包括信息的存储和检索两个过程。分类:1.依据数据格式和检索技术的层次不同,信息检索可以分为以下类型:(1)文本信息检索,(2)多媒体检索,超媒体及超文本检索。2.依据用户使用信息的目的不同,信息检索可以分为:(1)撰写论文的信息检索。(2)学科建设和科学研究的信息检索:a、立项查新;b、成果查新;
5、c、学科建设。(3)生产开发的信息检索。(4)回答或解决单一问题的信息检索。(5)对已知文献的查找。3.依据信息类型而划分的种类:可以分为事实与数值型信息检索、图书信息检索、期刊信息检索、专利信息检索、商标信息检索、学位论文检索、标准信息检索、科技报告信息检索等。7.检索工具:是人们用来存储、报道和查找各类信息的工具。类型:按所收信息的学科内容划分:检索工具中信息额学科内容有综合性、专科和专题之分。按著录信息的特征划分:目录,题录,文摘,索引。第二章 1.信息检索步骤:分析课题选择工具确定检索词编写检索式实施检索。2.检索途径:利用信息的特征来查询相关的信息,也就是用什么作为检索标识通过检索工
6、具查到所需的信息。可分为:主题途径、分类途径、著者途径和其他特殊途径。检索时应遵循“主题途径为主、多种检索途径综合应用”的总原则。3.主题途径:采用反映文献主题概念的检索词作为检索入口的一种检索途径;主题是一组具有共性事物的总称,用以表达文献所论述和研究的具体对象和问题,即中心内容。主题途径的优缺点:优点是适合特性检索,查准率高;缺点是通常不适合族性检索,查全率比分类号低;由于很规范,非专业人士难以掌握。4.分类途径:即人们常说的分类号检索,这种检索是根据信息内容的学科分类来进行。分类法,可以分为网络信息分类法、图书/资料分类法、专利分类法、标准分类法。真正具有系统性的分类途径主要是图书期刊分
7、类法和专利文献分类法的途径。国内的高校图书馆、公共图书馆以及大多数研究图书馆都采用中国图书馆分类法,用于图书和期刊的学科分类。分类途径的优缺点:优点:具有族性检索的功能,查全率较高;按照人们认识事物的习惯,以学科分类为基础,容易被人们接受和应用。缺点:不适用于特性检索,查准率比主题词低;不能适应学科发展中的变化,难以反映新学科和新名词术语;人们认识的不统一,往往造成分类不一致及排检的错误,不易反映交叉学科。5.检索式:是对检索课题的基本要求的表达式,也是要求检索工具执行的检索指令的核心内容。布尔逻辑检索算符:(1).逻辑“与”用“and”、“*”或者空格表示。在网络搜索引擎中习惯用逗号代替“o
8、r”。(2)、逻辑“或”用“or”、“+”或者逗号表示。(3)、逻辑“非”位置检索算符:意义:布尔逻辑检索算符只能呢个显示是否含有这些词汇,但是不能反映词汇的位置和艰巨,可能使检索产生歧义现象或者词之间的错误组配。位置兼作算符一般用于大型的联机数据库检索中,用来限制检索项之间的位置关系和前后次序。其目的是增强检索项组配的灵活性,更准确地表达复杂的检索概念。由于检索系统是按从左到右的顺序处理检索式,因此,应将限制醉眼的算符放在最左边。种类:(1)邻近位置检索算符(w);(2)邻词位置检索算符(nw);(3).句子位置检索算符(s)。截词检索:用截断的词的一个局部进行的检索,并认为凡满足这个词局部
9、中的所有字符(串)的文献,都为命中的文献。分为:前截词;后截词;中间截词。字段揭示算符及限制算符:同一词可能出现在同一条记录(Record)的不同字段(field)中,需要限定,缩小检索的范围,节约检索的时间。字段揭示算符一般用英文单词缩写揭示字段。字段限制算符通常使用数学公式的等号、大于符号、小于符号等,将检索内同限定在字段。第三章 1.搜索引擎:是 Internet 上的一种网站,它的主要任务是在 Internet 上主动搜索Web 服务器信息并将其自动索引,其索引内容存储于可供查询的大型数据库中,一个搜索引擎由搜索器、索引器、检索器和用户接口等 4 个部分组成。搜索引擎的工作原理:搜索引
10、擎的原理,可以看做三步:从互联网上抓取网页建立索引数据库在索引数据库中搜索排序。从互联网上抓取网页:利用能够从互联网上自动收集网页的 Spider 系统程序,自动访问互联网,并沿着任何网页中的所有 URL 爬到其它网页,重复这过程,并把爬过的所有网页收集回来。建立索引数据库:由分析索引系统程序对收集回来的网页进行分析,提取相关网页信息(包括网页所在 URL、编码类型、页面内容包含的关键词、关键词位置、生成时间、大小、与其它网页的链接关系等),根据一定的相关度算法进行大量复杂计算,得到每一个网页针对页面内容中及超链中每一个关键词的相关度(或重要性),然后用这些相关信息建立网页索引数据库。在索引数
11、据库中搜索排序:当用户输入关键词搜索后,由搜索系统程序从网页索引数据库中找到符合该关键词的所有相关网页。因为所有相关网页针对该关键词的相关度早已算好,所以只需按照现成的相关度数值排序,相关度越高,排名越靠前。最后,由页面生成系统将搜索结果的链接地址和页面内容摘要等内容组织起来返回给用户。2.Google 高级检索技巧:短语检索;字段限定检索(限定网站,限定网页,限定标题,限定文件类型,其他类型限定,其他高级检索特殊功能)。小技巧:1.双引号可以用减号代替。2.Google 不会处理一些特殊的字符。3.Google 允许一次搜索最多 32 个关键词。4.在单词前加符号可以搜索同义词。5.如果想得
12、到 Google 索引页面的总数,可以搜索*。6.Google 可以指定数字范围搜索。7.搜索define:css相当于搜索 css 的定义,这招对想学习知识的人很有效;也可以用what is css搜索;对中文来说,也可以用什么是 css之类的。8.Google 有一定的人工智能,可以识别一些简单的短语。9.通过link:语法,可以寻找含有某个链接的网页。10.如果在搜索的关键词的最后输入why?,就会在结果中出现链接到 Google Answers 的链接 http:/,在里面可以进行有偿提问。11.现在出现了一种兴趣活动,其内容是使用 Google 搜索一些特定的关键词,以便找到有漏洞的
13、、易被黑客攻击的站点。12.在 Google 中输入一组关键词时,默认是“与”搜索,就是搜索包含有所有关键词的网页。13.并非所有的 Google 服务都支持相同的语法,可以通过高级搜索来摸索这些关键词的用法:进入高级搜索之后设置搜索选项,然后观察关键字输入窗口中的关键字的变化。14.有时候 Google 懂得一些自然语言。15.并非所有的 Google 都是相同的,它因国家版本(或是说语言版本)而异。16.有时候 Google 会提示你搜索结果很烂。17.你可以在搜索时使用通配符*,这在搜索诗词时特别有效。18.同样,你的关键词可以全部都是通配符。四五六七八章基础知识要掌握。第七章 1.专利
14、:是指发明创造,特别是指专利说明书记载的专利技术或者产品。有时也是专利权或者专利信息的简称。专利的类型:发明专利,实用新型,外观设计。2.专利文献的特殊性:报道最新产品和技术;文献种类繁多,免费公开;格式复杂。3.部分符号术语的含义:优先权,专利国别代码(CN),申请号,专利号(ZL)。第十章 1.查全率:指系统在进行某一检索时,检索出的相关文献量与系统文献库中相关文献总量的比率。查全率=(检出相关文献量/文献库内相关文献总量)*100%2.查准率:指系统在进行某一检索时,检出的相关文献量与检出文献总量的比率。查准率=(检出相关文献量/检出文献总量)*100%3.提高查全率的基本方法:扩大检索
15、课题的目标,使用主要概念,排除次要概念;跨库检索;逐步扩大检索途径的检索范围;取消限定条件;降低检索词的专指度,可以从词表或检出文献中选一些上位词或相关词补充到检索式;外文单词使用截词检索;逐步扩大算符的检索范围,逐步提高查全率的算符依次是:位置算符(w)(nw)near逻辑算法 andor。4.提高查准率的方法:精确确定检索课题的目标;选择专业性检索工具;逐步缩小检索途径的检索范围;用不太常用的检索途径;提高检索词的专指度;逐步缩小算符的检索范围,依次是:逻辑算法 orand位置算符 near(nw)(w)。5.同时兼顾查全率和查准率的方法:跨库检索,使用综合检索工具,结合专业的检索工具;分类途径和主题途径等多途径结合使用;尝试多次检索,在失败中调节检索策略,阅读已知的信息,增加背景知识;预防操作错误,采用严谨科学的态度,耐心细致地检查检索步骤的各环节。