《《信息检索与利用》考点总结(共14页).doc》由会员分享,可在线阅读,更多相关《《信息检索与利用》考点总结(共14页).doc(14页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、精选优质文档-倾情为你奉上注:考试时,务必带上2B铅笔、橡皮擦,签字笔。考试题型:填空、简答、单选、多选、判断第一章绪论1、信息素养的概念、具体内容(内涵)答:概念:具有信息素养的人能够知道什么时候需要信息,能够有效地获取、评价和利用所需要的信息。 具体内容(内涵): 信息意识:敏感度信息知识:信息基本知识,检索技术等信息能力:选择能力、收集能力、判断能力、处理能力、利用能力信息道德:抵制不良信息、过滤粗糙信息、选择有利信息2、搜商的概念答:第一:搜商仅指人们运用搜索引擎的智力。这是狭义的“搜商”概念。第二:搜商是指运用物质性工具进行搜索的智力。这是一种广义搜商的概念。第三,搜商应指人们所有搜
2、索行为的智力。这是最广义的“搜商”概念,我们不妨叫它“泛搜商”。3、信息检索的意义 答:1)信息检索是大学生必备的基本素质2)信息检索是科学研究的重要前提3)信息检索是培养创新型人才的重要基础4)信息检索是个人终身学习的基本保障4、信息、知识、情报和文献的定义、关系;信息的基本特征;情报的属性;构成文献的基本要素 。答:定义:信息:信息是自然界、人类社会和人类思维活动中一切事物的存在方式和运动状态的本质属性和客观反映。 知识:知识是人们在改造客观世界的实践中所获得的认识和经验的总和。 情报:人们为解决某一个特定的问题而搜索、传递且有特定效用的知识或信息。 文献:记录有知识的一切载体。 关系:
3、1)包含关系:知识包含于信息中,信息包含了情报,文献也包含于信息内。2)转化关系:文献是记录有信息或知识的载体,当文献中记录的信息或知识传递给用户,并为用户所利用时,就转化为情报。例:图书馆馆藏图书。3)交叉关系:情报虽大多来自文献,但也可能来自口头和实物,所以情报与文献存在交叉关系。信息的基本特征:客观性,时效性,价值型,传递性,共享性,开发性。情报的属性(3种):知识性(信息性)、传递性和效用性(被用户所利用)。构成文献的基本要素(4个):1)知识内容:信息或知识2)记录符号:表达符号3)物质载体:材料4)记录手段:即将知识、信息固化到载体上的手段5、一些文献类型的特征号码(ISBN,IS
4、SN,CN,GB2763-87,GB/T,ISO,IEC)答:ISBN:国际标准书号(唯一性)。有ISBN号的一定是图书。ISBN号组成中不包括作者代号。ISSN:国际标准刊号。CN:国内统一刊号GB2763-87:国家标准GB/T:推荐性国家标准ISO:除电子电工外的国际标准IEC:电子电工领域国际标准6、文献的几种划分类型,按文献的载体形式划分(手写型文献、印刷型文献、缩微型文献、声像型文献、机读型文献);按文献的加工深度划分(零次文献、一次文献、二次文献、三次文献);按文献的出版形式划分11种、其中特种文献8种 P15-26答:1) 手写型印刷型缩微型 声像型 机读型2)零次文献:指未经
5、出版发行或未进入社会交流的最原始的文献。如私人笔记、工程图样、实验记录、论文草稿、发言稿、会议记录、私人信件、绝密文件、技术档案等。一次文献:是指以作者本人的生产实践、教学实践与科学研究成果为基本素材撰写并公开发表的文献。主要包括期刊论文、科技报告、会议论文、专利说明书、技术标准以及部分学位论文等,通常也称之为原始文献、原文。二次文献:是对一次/三次文献进行整理、加工的产品。即把大量的、分散的、无序的一次或三次文献按一定的方法进行加工、提炼、整理、简化,组织成为系统的便于查找的文献系统。 三次文献:是指围绕某一领域、某一学科或某一专题,利用二次文献检索搜集的大量一次文献,对其内容进行分析、综合
6、、提炼、重组、概括而成的文献,如各种述评、综述或进展性出版物,以及百科全书、字(辞)典等参考工具书 3)特种文献包括(8种):科技报告、会议文献、专利文献、标准文献、学位论文、政府出版物、产品资料、技术档案。 常见类型(3种):图书,期刊,报纸。7、图书、期刊的类型及特点。P18、P19答:图书类型:按其用途可分为三种类型: 1)阅读用书:教科书、专著、文集等。2)参考工具书 :字典、词典、百科全书等。3)检索用书:以图书形式刊行的书目、题录、文摘等。 图书特点: 优点:图书的内容全面系统,基础理论性强,论点成熟可靠。缺点:图书的撰写、编辑、出版所需要的时间较长,传递信息速度慢,不能及时反映最
7、新科技动态。科研人员一般不把它列为首选的使用对象。 期刊类型:期刊按其性质和用途不同,分为:1)学术性与技术性期刊2)检索性期刊:如社会科学文摘3)其他期刊 :包括快报性刊物、资料性刊物、科普性刊物等。按出版形式,分为:1)正式期刊:由国家新闻出版署严格审批,既有国际标准刊号ISSN,也有国内统一刊号CN2)非正式期刊:一般只限行业内部交流,不公开发行,其出版必须经过行政部门审核,并领取“内部报刊准印证”。期刊特点:期刊反映的多是最新的科技成果,内容新颖,信息量大,品种多,通报速度快、出版周期短等特点。是科研人员的首选信息源。按期连续出版,便于研究者长期跟踪研究。8、图书、期刊、报纸等8种文献
8、在数据库中的字段及参考文献著录格式 (各种类型文献的二次文献项目(即指具体每种类型在数据库中的字段)、有代表性的号码(ISBN、ISSN和CN、ISO、GB等)等。P15-P25答:图书形式特征 (即二次文献的项目)期刊的形式特征,即参考文献著录格式:著者.题(篇)名J.刊名,年,卷号(期号):引文所在的起始或起止页码。报纸参考文献著录格式:责任者. 题名文献类型标志/文献载体标志. 报纸名,出版日期(版次)示列:傅刚,赵承,李佳路. 大风沙过后的思考N. 北京青年报,2000-04-12(14).科技报告著录的项目:名称(项目名称、成果名称),完成(执行)的单位及人员,起止时间,关键词,项目
9、简介。科技报告的著录内容依次是:报告者.报告题名R.地点:报告机构,完成年。学位论文著录格式:作者,题名,导师,学位授予单位所在的城市,学位授予单位,学位授予时间。会议论文参考文献格式:论文作者.论文标题.见(英文用in):主编.论文集名C.出版地:出版者.出版年:起止页码.专利文献的著录格式:专利所有者、题名P、专利国别、专利号。标准文献形式特征:中文标准名称、发布日期、发布单位、实施日期、英文标准名称等。标准编号(标准号)是由“标准代号+顺序号+发布年号”组成。第二章 检索基础知识1、信息检索的含义 P29答:广义的检索包括信息的存储和检索两个过程。信息存储是将大量无序的信息集中起来,根据
10、信息源的外部特征和内容特征,经过整理、分类、浓缩、标引等处理,使其系统化、有序化,并按一定的技术要求建成一个具有检索功能的数据库或检索系统,供人们检索和利用。而检索是指运用编制好的检索工具或检索系统,查找出满足用户要求的特定信息。2、信息检索类型(按检索手段划分,按检索对象划分)P30-31答:按检索的手段划分:1)手工检索(Manual retrieval)2)计算机检索(Computerbased retrieval)按照检索的对象(或检索结果)划分:1)文献检索(相关性检索。如兰思仁的期刊论文,莫言的小说,毕业论文、专利、科技报告等)2)事实检索(确定性检索。如IBM总部、皖南事变)3)
11、数据检索(确定性检索。如08年汽车生产量、2014年GDP总量)4)声频与视频检索(确定性检索。如奥巴马就职演说音频等)3、信息检索系统、计算机检索系统的构成 P32 、P34答:信息检索系统的构成:1)检索文档-例:维普的期刊,馆藏书目,我校学位论文等2)检索设备-电脑、服务器、网络等3)系统规则-基本检索、高级检索、检索式检索等4)操作人员-用户等计算机检索系统构成:硬件设备,软件部分,数据库。4、数据库结构P35答:数据库结构组成:字段,记录,文档,帮助文件。5、信息标引 P37答:标引的概念:标引是指在文献信息的处理过程中,将文献的内容特征和外部特征分析转换成检索标识的过程,即对信息资
12、源中具有检索价值的特征信息。6、检索语言的概念,检索语言的类型(按表达信息的特征划分有哪些类型,按标识的组配方式可分为先组式语言与后组式语言)P39-P40答:检索语言作用:是标引者和检索者之间沟通的桥梁。(常考哦) 检索语言的类型:a) 按规范化程度分:自然语言/非规范化语言;受控语言/规范化语言/人工语言b) 按标识的组配方法分:先组式语言(如分类号,标题词);后组式语言(如关键词)c)按表述信息的特征分: 描述外部特征语言【题名 (书名、刊名等),责任者 (著者、编者、译者等),号码 (ISBN、报告号、专利号、标准号等),引文 (参考文献)】 描述内容特征语言【分类语言,主题语言】检索
13、语言定义:检索语言是根据信息检索的需要而创制的,能够唯一地表达各种概括文献信息内容的概念,能够显示概念之间的相互关系,并便于进行系统排列,便于将标引语言和检索用语进行相符性比较的人工语言。7、主题检索语言按照选词方式不同,可分为哪3种。P40答:按选词方式不同分为:1)标题词语言 (先组式、规范化的检索语言)2)叙词语言(后组式、规范化)3)关键词语言(后组式、不规范)8、主题检索语言、分类检索语言的特点p42 P44答:主题检索语言特点:直观性强、专指性强、灵活性强。分类检索语言的特点:1)分类语言是以文献信息内容所属的学科性质来划分和集中文献,能够较好的体现学科的系统性,便于人们从某学科或
14、专业的方面来查找文献2)分类语言能够较好的反映各个类目间的纵向层次关系3)分类语言是图书馆图书组织排架的依据。9、分类法有哪些?掌握中图法体系结构、标记符号P43-44答:有代表性的分类法:中国图书馆分类法(中图法)中国科学院图书馆图书分类法(科图法)中国人民大学图书馆图书分类法(人大法)杜威十进分类法(DDC)国际十进分类法(UDC)中国标准分类法(CCS)国际标准分类法(ICS)国际专利分类法(IPC) 中图法的体系结构:1)5个大部,22个大类(一级类目)2)每一大类下(拼音字母表示),层层划分,逐级展开为二级、三级、四级类目, 3)同位概念(并列关系、平行关系)P424)上位概念、下位
15、概念(隶属关系、从属关系)P42、43中图法的标记符号:1)中图法的分类号,采用汉语拼音字母与阿拉伯数字相结合的混合制号码2)大类(一级类目)由拼音字母表示,二级、三级等,由数字表示,同位类基本是十进制。3)特例:“工业技术”大类(T大类),所属的二级类目仍用字母表示,如TH、TP、TS4)分类号中,从左往右,每三位数字,用“”隔开 ,例S435.111.1S156.4 S718S571.1 TS272.52第三章 计算机检索基础知识 1、 布尔逻辑算符类型与用法P48答:基本的布尔逻辑算符:逻辑与、逻辑或、逻辑非。 逻辑与:也叫逻辑乘,常用符号“and”或“*”表示。 作用:增加限制因素,缩
16、小检索范围,提高检索的专指性。 逻辑或:常用符号“or”或“+”表示。作用:扩大检索范围,提高查全率。 逻辑非:常用符号“not”或“”表示。作用:缩小检索范围,提高查准率2、 截词检索(概念、截词方式、作用);位置算符(with、Near的用法(w)、(Nw)、(N)、(Nn);字段限定检索;短语检索算符P49-54答:截词检索(Truncation):是指用给定的词干做检索词,查找含有该词干的全部检索词的记录,也称词干检索或字符屏蔽检索。(多用于外文数据库)用于词干相同、词义相近,词形多样的检索词截词符常用?、*、$ 表示。截词的类型:1)按截词位置分4种: 前截词:截去某个词的前部,是词
17、的后方一致比较,也称后方一致检索(左截词)。例如:*magnetic 后截词:截去某个词的尾部,是词的前方一致比较,也称前方一致检索(右截词)。例如:comput* 中间截词:截去某个词的中间部分,使词的两边一致,也称两边一致检索。例如:输入organi?ation可以检出organization、organisation 前后截词:指同时在词干的前后两部分进行截词的方式。例如: *chemi*2)按截词数量分2种: 有限截词:一般用“ ?”表示,表示代替0或1个字或字符,例如:work?、work?、work?、20? 无限截词:一般用“ * ”表示,表示替代任意多个字符,即替代0n个字符,
18、例如:work*截词检索的作用:A、截词符具有“or”运算符功能,B、能够扩大检索范围,提高查全率C、减少了输入检索词的时间,节约了机时D、精简检索式位置检索算符:1.(W)与(nW)算符:a)(w)是with缩写,简写(),表示此算符两侧的检索词必须按此前后顺序相邻排列,词序不可变,且两词之间不许有其它的词或字母,但允许有一空格或标点符号。 如:CD(w)ROM相当于CD ROM或CD-ROM b)(nW)是n words的缩写,表示此算符两侧的检索词之间允许插入最多n个词,且词序不可变。 如:Wear(1W)material相当于Wear material、wear of material
19、2.(N),(nN)算符:a)(N)是near的缩写,表示此算符两侧的检索词必须相邻,词序不限,词间不允许插入其它词或字母,但允许有一空格或标点符号。 如:CD(N)ROM相当于CD ROM或CD-ROM或ROM CD或ROM-CDb) (nN)表示两词间可插入最多n个词,词序不限。 如:railway(2N)bridge可表示Railway bridge、bridge of railway、bridge of the railway字段限定算符是把检索词限定在记录中出现的某个或某些字段中。字段有两种:1)基本字段:能够揭示文献的主要内容特征。如:字段代码:题名(TI)、摘要(AB)、主题词(
20、DE),分类号等。 2)辅助字段:表示文献的外部特征。如:著者(AU)、出版年(PY)、刊名(JN)、语种(LA)、文献类型(DT)、机构(CS)等。字段检索:对于在“基本索引字段(TI、AB、DE、ID)”中的查找,用后缀方式常用符号有“/”或“in”;对于在“辅助索引字段(AU、BN、SN、CC等)”中的查找,用前缀方式常用符号有“=”“=”“”“”等。短语检索算符:用双引号表示,主用于提高检索精度和准确度。3、 信息检索途径的定义,常用信息检索途径(主题、分类、著者、题名、号码等),重点掌握主题途径、分类途径的用法、优缺点、查全、查准效果比较P60答:信息检索途径 检索入口(字段):1)
21、分类途径分类号字段2)主题途径题名、关键词、题名或关键词、摘要、主题、任意字段3)题名途径题名(标题、篇名)、书名、刊名4)著者途径作者、导师、专利权人、发明人5)号码途径专利号、标准号、ISBN、ISSN6)其他途径分子式、环系结构、属种名称、机构分类途径的优缺点:优点:按学科、专业集中相关文献信息,具有族性检索的功能(能够把同一学科的文献信息集中在一起检索出来),查全率较高。以学科分类为基础,符合人们认识事物的习惯,一旦熟悉分类体系很容易被人接受和使用。缺点:不适用于特性检索(复杂冗长的专题信息检索),查准率比主题词低。对全面检索边缘、交叉学科资料造成较大的困难;分类表一般几年才修订一次,
22、难以反映新学科和新名词术语。主题途径的优缺点:优点:直观性、专指性、灵活性,适合特性检索,查准率高。用词或词组作检索标识,表达概念灵活、准确、专指性强,能把同一主题内容的文献集中在一起同时检索出来。如:“C语言-程序设计”比用分类号TP312表达更准确。 缺点:不适合族性检索(检索到的信息同属一类学科或者专业),查全率比分类号低。由于很规范,非专业人士难以掌握。如:检索“大学教材”应选择“高校”为主题词。4、 计算机检索的主要步骤(信息检索流程),主题概念的选词方法,同义词的扩展(如:学名或俗名,上位词和下位词,简称与全称,术语与代码等)P60答:信息检索步骤;分析检索需求,明确检索目标、内容
23、和范围。 选择检索字段 选择检索数据库和检索书刊 选择检索途径 选择检索词 构建检索式 实施检索并调整检索式 输出检索结果及获得原始信息。5、 检索表达式的构建 P66 (参照课题分析P303)答:检索表达式:又称检索式,是指将选择出的检索词,用布尔逻辑算符、截词算符、字段代码及位置算符等,按课题的需要,合理组配,形成表达具体信息需求的逻辑表达式。表达式构建的注意事项:主题词的选取1、课题名称主题词2、检索词与字段的配合3、相关概念(隐性概念)的分析4、无关概念的排除(如研究、方法、技术、作用、现状、近况、展望、发展趋势、应用、利用、建立、实施、影响、效率、结构等这些词都不要)第四章 搜索引擎
24、 (P54)1、 搜索引擎关键词语法规则(布尔逻辑算符、截词算符、字段限定检索、邻近符等)答:布尔逻辑算符:(1) 逻辑“与”逻辑“与”一般用空格、“AND”表示,有的搜索引擎还可以用“&”表示。使用逻辑“与”是为了要求检索结果的Web 页面中同时出现所有输入的检索词,提高查准率。(2) 逻辑“或”逻辑“或”一般用“OR”表示,有的搜索引擎还可以用“|”、“,”表示。使用逻辑“或”是为了允许检索结果的Web 页面中出现输入检索词的任何一个,提高查全率。(3) 逻辑“非”逻辑“非”一般用“NOT”表示,有的搜索引擎还可用“!” “-” 表示。使用逻辑“非”是为了要求检索结果的Web 页面中出现N
25、OT 前的检索词,但排除含有NOT 后的检索词的页面信息,以缩小检索范围。字段限定: intitle:在标题中搜索,表示限定词后接的词必须出现在网页的标题内 site:将搜索范围限定在某类站点或某个网站内。 filetype:找特定类型的文件。文件的类型:word、excel、pdf、powerpoint、压缩文件、文本文件等2、 常用搜索引擎选介、如百度、谷歌检索规则与技巧3、 谷歌的图书、学术搜索及百度的学术搜索、百度文库等。第五章 专利及专利文献 1、专利概念答:专利的基本概念:专利法保护的发明创造;是指载有发明创造详细内容的专利说明书;是指专利权。2、专利基本特性(独占性、时间性、地域
26、性)答:专有性、时限性和地域性。4、 专利类型答:专利类型:发明专利、实用新型专利、外观设计专利5、 我国授予专利权的基本条件(新颖性、创造性、实用性)答:专利三性:新颖性、创造性、实用性6、 专利号(申请号)组成答:申请号:2003年10月起中国专利申请号扩编,9位变13位。专利申请号:外观设计专利。例CN7 、CN 专利号:专利号与申请号,数字部分相同。专利授权后,申请号的前缀CN,改为ZL。如:ZL.2;ZL1.3 7、 可供检索专利的数据库或网站答:检索专利的数据库:万方数据库、清华同方(CNKI)、超星读秀学术搜索、中国知识产权局、Fulink平台第六章 检索通用规则(P77)、毕业
27、论文与学术论文集P3411、 检索平台通用规则(掌握一个检索平台(或数据库),可从哪几个方面入手)P80答:1)了解数据库概况,重点掌握各数据库收录文献情况2)了解数据库平台的资源组织方式,提供的检索方式(如快速检索、高级检索、分类检索、专业检索等)3)掌握检索系统的具体运算符号(布尔逻辑符号、截词算符、位置算符、字段限定符等)4)掌握检索结果的输出5)了解个性化服务功能2、 三大中文数据库平台运算符配备情况P83答:3、运算符在维普数据库平台不同检索方式中表现形式P83答:4、学位论文的结构: P347答:前置部分(包括封面,摘要,关键词,目录)主体部分(包括引言,正文,结论,致谢,参考文献
28、)附录部分(必要时)结尾部分(必要时)5、学术规范(定义、内容)P350答:看书6、学术不端论文检索系统(AMLC)P356答:看书第七章 检索效率 P2951、 检索效率答:2、 检索效率评价指标(查全率、查准率)答:查全率(Recall ratio,R):又称检全率、召回率,是指检出的相关信息数量与检索系统中全部相关信息总量的比率。 查准率(Precision ratio,P):也称检准率、精确率,是指检出的相关信息数量与检出的全部信息总量的比率。 3、 查全率、查准率的计算公式答:4、 影响信息检索效率的因素答:1)检索词的选取存在问题 2)检索限制过于严格或宽松3)检索关系的组配不准确
29、 4)检索词与字段检索配合不当 5)截词使用不当6)未能充分掌握数据库的检索特点 5、 提高信息检索效果的主要措施答:1)提高查全率的方法2)提高查准率的方法 3)同时兼顾查全率和查准率的措施实习:数据库:维普数据库中国知网系列数据库(cnki)、万方数据、fulink平台,馆藏书目数据库,数字图书馆(超星汇雅电子书、方正电子书等、),超星读秀学术搜索,Web of science,Science Dierct数据库、Springerlink全文数据库,搜索引擎使用技巧,google学术搜索、文献管理软件(国外ENDNOTE,国产NoteExpress等)。掌握以上数据库可检索的文献类型、可检索字段及检索方法、,具体数据库的检索策略(查全与查准)的调整。专心-专注-专业