《2022年信息检索与利用考点总结 .docx》由会员分享,可在线阅读,更多相关《2022年信息检索与利用考点总结 .docx(14页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、精品_精品资料_注:考试时,务必带上2B 铅笔、橡皮擦,签字笔.考试题型:填空、简答、单项、多项、判定第一章绪论1、信息素养的概念、具体内容 内涵 答:概念:具有信息素养的人能够知道什么时候需要信息,能够有效的猎取、评判和利用所需要的信息.具体内容 内涵 : 信息意识:敏锐度信息学问:信息基本学问,检索技术等信息才能:挑选才能、收集才能、判定才能、处理才能、利用才能信息道德:抵制不良信息、过滤粗糙信息、挑选有利信息2、搜商的概念答:第一:搜商仅指人们运用搜寻引擎的智力.这是狭义的“搜商”概念.其次:搜商是指运用物质性工具进行搜寻的智力.这是一种广义搜商的概念.第三,搜商应指人们全部搜寻行为的智
2、力.这是最广义的“搜商”概念,我们不妨叫它“泛搜商”.3、信息检索的意义答: 1)信息检索是高校生必备的基本素养2)信息检索是科学讨论的重要前提3) 信息检索是培育创新型人才的重要基础4) 信息检索是个人终身学习的基本保证4、信息、学问、情报和文献的定义、关系.信息的基本特点.情报的属性.构成文献的基本要素.答:定义:信息:信息是自然界、人类社会和人类思维活动中一切事物的存在方式和运动状态的本质属性和客观反映.学问:学问是人们在改造客观世界的实践中所获得的熟识和体会的总和.情报:人们为解决某一个特定的问题而搜寻、传递且有特定效用的学问或信息.文献:记录有学问的一切载体.关系: 1 包含关系:学
3、问包含于信息中,信息包含了情报,文献也包含于信息内.2) 转化关系: 文献是记录有信息或学问的载体,当文献中记录的信息或学问传递给用户,并为用户所利用时,就转化为情报.例:图书馆馆藏图书.3) 交叉关系: 情报虽大多来自文献, 但也可能来自口头和实物,所以情报与文献存在交叉关系.信息的基本特点:客观性,时效性,价值型,传递性,共享性,开发性.情报的属性( 3 种):学问性(信息性) 、传递性和效用性(被用户所利用).构成文献的基本要素(4 个):1) 学问内容:信息或学问2) 记录符号:表达符号3) 物质载体:材料可编辑资料 - - - 欢迎下载精品_精品资料_4) 记录手段:即将学问、信息固
4、化到载体上的手段5、一些文献类型的特点号码(ISBN,ISSN, CN, GB2763-87, GB/T, ISO, IEC)答: ISBN:国际标准书号(唯独性) .有 ISBN 号的肯定是图书. ISBN 号组成中不包括作者代号.ISSN:国际标准刊号.CN:国内统一刊号GB2763-87:国家标准GB/T:举荐性国家标准ISO:除电子电工外的国际标准IEC:电子电工领域国际标准6、文献的几种划分类型,按文献的载体形式划分(手写型文献、印刷型文献、缩微型文献、声像型文献、机读型文献) .按文献的加工深度划分(零次文献、一次文献、二次文献、三次文献).按文献的出版形式划分11 种、其中特种文
5、献8 种 P15-26答: 1) 手写型印刷型缩微型声像型机读型2)零次文献:指未经出版发行或未进入社会沟通的最原始的文献.如私人笔记、工程图样、试验记录、论文草稿、发言稿、会议记录、私人信件、绝密文件、技术档案等.一次文献: 是指以作者本人的生产实践、教学实践与科学讨论成果为基本素材撰写并公开发表的文献. 主要包括期刊论文、 科技报告、 会谈论文、 专利说明书、技术标准以及部分学位论文等,通常也称之为原始文献、原文.二次文献:是对一次 / 三次文献进行整理、加工的产品.即把大量的、分散的、无序的一次或三次文献按肯定的方法进行加工、提炼、整理、简化,组织成为系统的便于查找的文献系统.三次文献:
6、 是指环绕某一领域、 某一学科或某一专题, 利用二次文献检索搜集的大量一次文献,对其内容进行分析、综合、提炼、重组、概括而成的文献,如各种述评、综述或进展性出版物,以及百科全书、字(辞)典等参考工具书3)特种文献包括( 8 种):科技报告、会议文献、专利文献、标准文献、学位论文、政府出版物、产品资料、技术档案.常见类型( 3 种):图书,期刊,报纸.7、图书、期刊的类型及特点.P18、P19答:图书类型:按其用途可分为三种类型:1) 阅读用书:教科书、专著、文集等.可编辑资料 - - - 欢迎下载精品_精品资料_2) 参考工具书:字典、词典、百科全书等.3) 检索用书:以图书形式刊行的书目、题
7、录、文摘等.图书特点:优点: 图书的内容全面系统,基础理论性强,论点成熟牢靠.缺点 : 图书的撰写、编辑、出版所需要的时间较长,传递信息速度慢,不能准时反映最新科技动态.科研人员一般不把它列为首选的使用对象.期刊类型:期刊按其性质和用途不同,分为:1) 学术性与技术性期刊2) 检干脆期刊:如社会科学文摘3) 其他期刊 :包括快报性刊物、资料性刊物、科普性刊物等.按出版形式,分为:1)正式期刊:由国家新闻出版署严格审批,既有国际标准刊号ISSN,也有国内统一刊号CN 2)非正式期刊:一般只限行业内部沟通,不公开发行,其出版必需经过行政部门审核,并领取“内部报刊准印证”.期刊特点:期刊反映的多是最
8、新的科技成果,内容新奇,信息量大,品种多,通报速度快、出版周期短等特点.是科研人员的首选信息源.按期连续出版,便于讨论者长期跟踪讨论.8、图书、期刊、报纸等8 种文献在数据库中的字段及参考文献著录格式 各种类型文献的二次文献项目 (即指具体每种类型在数据库中的字段)、有代表性的号码 ( ISBN、ISSN 和 CN、ISO、GB等)等.P15-P25答:图书形式特点(即二次文献的项目)期刊的形式特点,即参考文献著录格式:著者 . 题 篇 名J.刊名 , 年,卷号 期号 :引文所在的起始或起止页码.报纸参考文献著录格式:责任者 .题名 文献类型标志 / 文献载体标志 .报纸名,出版日期(版次)示
9、列:傅刚,赵承,李佳路.大风沙过后的摸索N.北京青年报 ,2022-04-12( 14).科技报告著录的项目:名称(项目名称、成果名称) ,完成(执行)的单位及人员,起止时间,关键词,项目简介.科技报告的著录内容依次是:报告者. 报告题名 R.的点:报告机构,完成年.学位论文著录格式:作者,题名,导师,学位授予单位所在的城市,学位授予单位,学位授予时间.会谈论文参考文献格式:论文作者 . 论文标题 . 见(英文用 in ):主编 . 论文集名 C.出版的:出版者 . 出版年:起止页码.专利文献的著录格式:可编辑资料 - - - 欢迎下载精品_精品资料_专利全部者、题名 P 、专利国别、专利号.
10、标准文献形式特点:中文标准名称、发布日期、发布单位、实施日期、英文标准名称等.标准编号(标准号)是由“标准代号+次序号 +发布年号”组成.其次章检索基础学问1、信息检索的含义P29答:广义的检索包括信息的储备和检索两个过程.信息储备是将大量无序的信息集中起来,依据信息源的外部特点和内容特点,经过整理、分类、浓缩、标引等处理,使其系统化、有序化,并按肯定的技术要求建成一个具有检索功能的数据库或检索系统,供人们检索和利用.而检索是指运用编制好的检索工具或检索系统,查找出满意用户要求的特定信息.2、信息检索类型(按检索手段划分,按检索对象划分)P30-31答:按检索的手段划分:1)手工检索 Manu
11、al retrieval 2)运算机检索 Computer based retrieval 依据检索的对象 或检索结果 划分:1) 文献检索(相关性检索.如兰思仁的期刊论文,莫言的小说,毕业论文、专利、科技报告等)2) 事实检索(确定性检索.如IBM 总部、皖南事变)3) 数据检索(确定性检索.如08 年汽车生产量、 2022 年 GDP总量)4) 声频与视频检索(确定性检索.如奥巴马就职演说音频等)3、信息检索系统、运算机检索系统的构成P32 、 P34答:信息检索系统的构成:1) 检索文档 - 例:维普的期刊,馆藏书目,我校学位论文等2) 检索设备 - 电脑、服务器、网络等3) 系统规章
12、- 基本检索、高级检索、检索式检索等4) 操作人员 - 用户等运算机检索系统构成:硬件设备,软件部分,数据库.4、数据库结构 P35答:数据库结构组成:字段,记录,文档,帮忙文件.可编辑资料 - - - 欢迎下载精品_精品资料_5、信息标引 P37答: 标引的概念: 标引是指在文献信息的处理过程中,将文献的内容特点和外部特点分析转换成检索标识的过程,即对信息资源中具有检索价值的特点信息.6、检索语言的概念,检索语言的类型(按表达信息的特点划分有哪些类型,按标识的组配方式可分为先组式语言与后组式语言)P39-P40答:检索语言作用:是标引者和检索者之间沟通的桥梁.(常考哦 ) 检索语言的类型 :
13、a) 按规范化程度分 :自然语言 / 非规范化语言 ;受控语言 / 规范化语言 / 人工语言b) 按标识的组配方法分 :先组式语言(如分类号,标题词);后组式语言(如关键词)c) 按表述信息的特点分 :描述外部特点语言【题名 书名、刊名等 , 责任者 著者、编者、译者等, 号码ISBN 、报告号、专利号、标准号等), 引文 参考文献 】描述内容特点语言【分类语言,主题语言】检索语言定义: 检索语言是依据信息检索的需要而创制的,能够唯独的表达各种概括文献信息内容的概念, 能够显示概念之间的相互关系,并便于进行系统排列,便于将标引语言和检索用语进行相符性比较的人工语言.7、主题检索语言依据选词方式
14、不同,可分为哪3 种. P40答:按选词方式不同分为:1)标题词语言(先组式、规范化的检索语言)2) 叙词语言(后组式、规范化)3) 关键词语言(后组式、不规范)8、主题检索语言、分类检索语言的特点p42 P44答:主题检索语言特点:直观性强、专指性强、敏捷性强.分类检索语言的特点:1)分类语言是以文献信息内容所属的学科性质来划分和集中文 献,能够较好的表达学科的系统性,便于人们从某学科或专业的方面来查找文献 2)分类语言能够较好的反映各个类目间的纵向层次关系3)分类语言是图书馆图书组织排架的依据.9、分类法有哪些把握中图法体系结构、标记符号P43-44答:有代表性的分类法:中国图书馆分类法
15、(中图法)中国科学院图书馆图书分类法(科图法)中国人民高校图书馆图书分类法(人大法)可编辑资料 - - - 欢迎下载精品_精品资料_杜威十进分类法 ( DDC)国际十进分类法 ( UDC)中国标准分类法 ( CCS)国际标准分类法 ( ICS)国际专利分类法 ( IPC)中图法的体系结构:1) 5 个大部, 22 个大类(一级类目)2) 每一大类下(拼音字母表示) ,层层划分,逐级绽开为二级、三级、四级类目,3) 同位概念(并列关系、平行关系)P424) 上位概念、下位概念(隶属关系、从属关系) P42、43中图法的标记符号:1) 中图法的分类号,采纳汉语拼音字母与阿拉伯数字相结合的混合制号码
16、2) 大类(一级类目)由拼音字母表示,二级、三级等,由数字表示,同位类基本是十进制.3) 特例:“工业技术”大类( T 大类),所属的二级类目仍用字母表示,如TH、TP、TS4) 分类号中,从左往右,每三位数字,用“”隔开,例S718第三章运算机检索基础学问1、 布尔规律算符类型与用法P48答:基本的布尔规律算符:规律与、规律或、规律非.规律与:也叫规律乘,常用符号“and”或“ * ”表示. 作用:增加限制因素,缩小检索范畴,提高检索的专指性.规律或:常用符号“ or ”或“ +”表示.作用:扩大检索范畴,提高查全率.规律非:常用符号“ not ”或“”表示.作用:缩小检索范畴,提高查准率2
17、、 截词检索(概念、截词方式、作用).位置算符( with 、 Near的用法( w)、( Nw)、( N)、( Nn) .字段限定检索.短语检索算符P49-54答: 截词检索 Truncation:是指用给定的词干做检索词,查找含有该词干的全部检索词的记录,也称词干检索或字符屏蔽检索.(多用于外文数据库)用于词干相同、词义相近, 词形多样的检索词截词符常用、*、 $ 表示.可编辑资料 - - - 欢迎下载精品_精品资料_截词的类型:1)按截词位置分 4 种:前截词: 截去某个词的前部, 是词的后方一样比较, 也称后方一样检索 (左截词).例如:*magnetic后截词: 截去某个词的尾部,
18、是词的前方一样比较, 也称前方一样检索 (右截词).例如:comput*中间截词:截去某个词的中间部分,使词的两边一样,也称两边一样检索.例如:输入organiation可以检出 organization、organisation前后截词:指同时在词干的前后两部分进行截词的方式.例如: *chemi* 2)按截词数量分 2 种:有限截词:一般用“”表示,表示代替0 或 1 个字或字符,例如: work 、work 、work 、20无限截词:一般用“*”表示,表示替代任意多个字符,即替代0 n 个字符,例如:work*截词检索的作用 :A、截词符具有“ or ”运算符功能, B、能够扩大检索范
19、畴,提高查全率C、削减了输入检索词的时间,节省了机时D、精简检索式位置检索算符 :1. ( W)与 nW 算符:aw 是 with缩写,简写() ,表示此算符两侧的检索词必需按此前后次序相邻排列,词序不行变,且两词之间不许有其它的词或字母,但答应有一空格或标点符号.如: CDwROM相当于 CD ROM或 CD-ROMbnW 是 n words的缩写 , 表示此算符两侧的检索词之间答应插入最多n 个词,且词序不行变.如: Wear1Wmaterial相当于 Wear material、wear of material2. ( N),(nN)算符:a) ( N)是 near 的缩写,表示此算符两
20、侧的检索词必需相邻,词序不限,词间不答应插入其它词或字母,但答应有一空格或标点符号.如: CDNROM相当于 CD ROM或 CD-ROM或 ROM CD或 ROM-CDb) nN 表示两词间可插入最多n 个词,词序不限.如: railway2Nbridge可表示 Railway bridge、bridge of railway、bridge of the railway字段限定算符是把检索词限定在记录中显现的某个或某些字段中.字段有两种: 1)基本字段:能够揭示文献的主要内容特点.如:字段代码:题名(TI )、摘要( AB)、主题词( DE),分类号等.2)帮助字段: 表示文献的外部特点.如
21、:著者( AU)、出版年( PY)、刊名(JN)、语种( LA)、文献类型( DT)、机构( CS)等.字段检索:对于在“基本索引字段(TI 、AB、DE、 ID)”中的查找,用后缀方式常用符号有“ / ”或“ in ”.对于在“帮助索引字段(AU、BN、SN、CC等)”中的查找,用前缀方式常用符号有“ =”“ =”“”“ ”等.短语检索算符:用双引号表示,主用于提高检索精度和精确度.可编辑资料 - - - 欢迎下载精品_精品资料_3、 信息检索途径的定义,常用信息检索途径 主题、分类、著者、题名、号码等 ,重点把握主题途径、分类途径的用法、优缺点、查全、查准成效比较P60答:信息检索途径检索
22、入口(字段) :1) 分类途径分类号字段2) 主题途径题名、关键词、题名或关键词、摘要、主题、任意字段3) 题名途径题名(标题、篇名)、书名、刊名4) 著者途径作者、导师、专利权人、创造人5) 号码途径专利号、标准号、ISBN、ISSN6) 其他途径分子式、环系结构、属种名称、机构分类途径的优缺点:优点:按学科、专业集中相关文献信息,具有族性检索的功能(能够把同一学科的文献信息集中在一起检索出来) ,查全率较高. 以学科分类为基础, 符合人们熟识事物的习惯, 一旦熟识分类体系很简单被人接受和使用.缺点:不适用于特性检索(复杂冗长的专题信息检索),查准率比主题词低.对全面检索边 缘、交叉学科资料
23、造成较大的困难.分类表一般几年才修订一次,难以反映新学科和新名词术语.主题途径的优缺点:优点:直观性、专指性、敏捷性,适合特性检索,查准率高.用词或词组作检索标识,表达概念敏捷、 精确、专指性强, 能把同一主题内容的文献集中在一起同时检索出来.如: “ C语言 - 程序设计”比用分类号TP312 表达更精确.缺点:不适合族性检索(检索到的信息同属一类学科或者专业),查全率比分类号低.由于很规范,非专业人士难以把握.如:检索“高校教材”应挑选“高校”为主题词.4、 运算机检索的主要步骤(信息检索流程) ,主题概念的选词方法,同义词的扩展(如: 学名或俗名,上位词和下位词,简称与全称,术语与代码等
24、) P60答:信息检索步骤.分析检索需求,明确检索目标、内容和范畴. 挑选检索字段 挑选检索数据库和检索书刊 挑选检索途径 挑选检索词 构建检索式 实施检索并调整检索式 输出检索结果及获得原始信息.5、 检索表达式的构建P66(参照课题分析 P303)答:检索表达式:又称检索式,是指将挑选出的检索词,用布尔规律算符、截词算符、字段代码及位置算符等,按课题的需要, 合理组配, 形成表达具体信息需求的规律表达式.可编辑资料 - - - 欢迎下载精品_精品资料_表达式构建的留意事项: 主题词的选取1、课题名称主题词2、检索词与字段的协作3、相关概念(隐性概念)的分析4、无关概念的排除(如讨论、方法、
25、技术、作用、现状、近况、展望、进展趋势、应用、利用、建立、实施、影响、效率、结构等这些词都不要)第四章 搜寻引擎 ( P54)1、 搜寻引擎关键词语法规章(布尔规律算符、截词算符、字段限定检索、邻近符等) 答:布尔规律算符:(1) 规律“与”规律“与”一般用空格、 “ AND”表示,有的搜寻引擎仍可以用“ &”表示.使用规律“与” 是为了要求检索结果的 Web 页面中同时显现全部输入的检索词,提高查准率.(2) 规律“或”规律“或”一般用“ OR”表示,有的搜寻引擎仍可以用“ | ”、“ , ”表示.使用规律“或” 是为了答应检索结果的 Web 页面中显现输入检索词的任何一个,提高查全率.(3
26、) 规律“非”规律“非”一般用“ NOT”表示,有的搜寻引擎仍可用“; ” “ - ” 表示.使用规律“非”是为了要求检索结果的 Web 页面中显现 NOT 前的检索词, 但排除含有 NOT 后的检索词的页面信息,以缩小检索范畴.字段限定: intitle:在标题中搜寻,表示限定词后接的词必需显现在网页的标题内 site:将搜寻范畴限定在某类站点或某个网站内. filetype:找特定类型的文件.文件的类型:word、 excel 、pdf 、 powerpoint、压缩文件、文本文件等2、 常用搜寻引擎选介、如百度、谷歌检索规章与技巧3、 谷歌的图书、学术搜寻及百度的学术搜寻、百度文库等.可
27、编辑资料 - - - 欢迎下载精品_精品资料_第五章专利及专利文献1、 专利概念答:专利的基本概念:专利法爱护的创造制造.是指载有创造制造具体内容的专利说明书. 是指专利权.2、 专利基本特性(独占性、时间性、的域性) 答:专有性、时限性和的域性.4、 专利类型答:专利类型:创造专利、有用新型专利、外观设计专利5、 我国授予专利权的基本条件(新奇性、制造性、有用性) 答:专利三性:新奇性、制造性、有用性6、 专利号(申请号)组成答:申请号: 2022 年 10 月起中国专利申请号扩编,9 位变 13 位.专利申请号:外观设计专利.例CN1757 、CN专利号:专利号与申请号,数字部分相同.专利
28、授权后,申请号的前缀CN,改为 ZL.如: .7、 可供检索专利的数据库或网站答:检索专利的数据库:万方数据库、清华同方(CNKI)、超星读秀学术搜寻、中国学问产权局、 Fulink平台第六章检索通用规章( P77)、毕业论文与学术论文集P3411、 检索平台通用规章(把握一个检索平台(或数据库),可从哪几个方面入手)P80答: 1)明白数据库概况,重点把握各数据库收录文献情形2)明白数据库平台的资源组织方式,供应的检索方式(如快速检索、高级检索、分类检索、专业检索等) 3)把握检索系统的具体运算符号(布尔规律符号、截词算符、位置算符、字段限定符等)4) 把握检索结果的输出可编辑资料 - -
29、- 欢迎下载精品_精品资料_5) 明白个性化服务功能2、 三大中文数据库平台运算符配备情形P83答:3、 运算符在维普数据库平台不同检索方式中表现形式P83答:4、学位论文的结构:P347答:前置部分(包括封面,摘要,关键词,目录)主体部分(包括引言,正文,结论,致谢,参考文献) 附录部分(必要时)结尾部分(必要时)5、学术规范(定义、内容)P350答:看书6、学术不端论文检索系统(AMLC) P356答:看书第七章检索效率 P295 1、 检索效率答:2、 检索效率评判指标(查全率、查准率)答:查全率( Recallratio,R):又称检全率、召回率,是指检出的相关信息数量与检索系统中全部
30、相关信息总量的比率.查准率( Precisionratio,P):也称检准率、精确率,是指检出的相关信息数量与检出的全部信息总量的比率.3、 查全率、查准率的运算公式答:可编辑资料 - - - 欢迎下载精品_精品资料_4、 影响信息检索效率的因素答: 1)检索词的选取存在问题2) 检索限制过于严格或宽松3) 检索关系的组配不精确4) 检索词与字段检索协作不当5) 截词使用不当6) 未能充分把握数据库的检索特点5、 提高信息检索成效的主要措施答: 1)提高查全率的方法2) 提高查准率的方法3) 同时兼顾查全率和查准率的措施实习:数据库:维普数据库中国知网系列数据库cnki、万方数据、 fulink平台,馆藏书目数据 库,数字图书馆(超星汇雅电子书、方正电子书等、),超星读秀学术搜寻, Webof science , ScienceDierct数据库、 Springerlink全文数据库, 搜寻引擎使用技巧,google 学术搜寻、文献治理软件(国外ENDNOT,E国产 NoteExpress等).把握以上数据库可检索的文献类型、可检索字段及检索方法、,具体数据库的检索策略(查全与查准)的调整.可编辑资料 - - - 欢迎下载