《文献检索概论 .ppt》由会员分享,可在线阅读,更多相关《文献检索概论 .ppt(101页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、1医学文献检索主讲:杨慕莲2事后查明,早在事后查明,早在十多年前十多年前,就有人研究出来了,方法,就有人研究出来了,方法非常简单,只需在甲醇中非常简单,只需在甲醇中加入加入2%2%的水的水即可,检索这篇即可,检索这篇文献的时间是文献的时间是1010多分钟多分钟。两个小故事两个小故事美国在实施美国在实施“阿波罗登月计划阿波罗登月计划”中,对阿波罗飞船的燃中,对阿波罗飞船的燃料箱进行压力实验时,发现甲醇会引起钛应力腐蚀,为料箱进行压力实验时,发现甲醇会引起钛应力腐蚀,为此付出了此付出了数百万美元数百万美元来研究解决这一问题。来研究解决这一问题。3 南方医院曾经有位老主任,为了“通过测定羊通过测定羊
2、水中氨基酸成分鉴别胎儿性别水中氨基酸成分鉴别胎儿性别”的课题,几乎查遍了图书馆收藏的所有书刊而毫无头绪。原因:没有掌握文献检索技能,不知原因:没有掌握文献检索技能,不知道查文献也有一套科学的方法。道查文献也有一套科学的方法。?4课程有关情况介绍课程有关情况介绍课程性质课程性质开课目的开课目的课程介绍课程介绍教学安排教学安排5n本课程是一门关于如何查找文献、知识和信息的工具性课程。n培养学生的信息意识,掌握用手工方式和计算机方式从文献中获取知识和情报的一门科学方法课,是提高学生自学能力和独立研究问题能力的工具课。课课 程程 性性 质质6知识有两类:一类是我们自己知道的,另一类是我们在什么地方可以
3、找到。n增强文献信息检索与利用的意识意识;n熟悉文献信息检索与利用的基本工具基本工具;n掌握文献信息检索与利用的基本方法基本方法;n为继续学习和终生学习打下良好的基础。开开 课课 目目 的的7为什么要开这门课?n现状:信息爆炸环境n全世界每年出版图书图书80万种,期刊期刊40万种,其它文献信息资料400万种;n发表科学论文大约600万篇,平均每天14000篇左右,每35秒就有1篇论文发表,不到1分钟就有1本新书问世,每小时出现近20项技术发明,每天约有40亿个信息单位的信息量向世界发送信息爆炸8信息时代科技工作者的痛苦是什么信息时代科技工作者的痛苦是什么?n我们生活在一个我们生活在一个信息过度
4、膨胀的年代信息过度膨胀的年代,各种各样的信息,各种各样的信息,有用的和没有用的,都充斥在我们周围。有用的和没有用的,都充斥在我们周围。n如何从中选取其中如何从中选取其中有利的信息有利的信息以达到我们的目的,以及以达到我们的目的,以及如何如何快速准确的选取信息快速准确的选取信息以提高我们的效率是一个值得以提高我们的效率是一个值得也是必要学习的内容。也是必要学习的内容。n是是信息太多信息太多而不是没有信息!而不是没有信息!9自己的亲人生了重病怎么办?自己的亲人生了重病怎么办?n超星数字图书馆超星数字图书馆中有丰富的医学藏书,中有丰富的医学藏书,你可以对该疾病有一个全面的了解;你可以对该疾病有一个全
5、面的了解;n中国期刊网中国期刊网有各种医学杂志,上面有专有各种医学杂志,上面有专家权威关于该疾病的最新治疗方法;家权威关于该疾病的最新治疗方法;n网络上网络上有很多专家权威治疗该疾病的信有很多专家权威治疗该疾病的信息和联系方式。息和联系方式。10n现在,除了课题研究方面,信息检索已经现在,除了课题研究方面,信息检索已经渗透到我的生活渗透到我的生活中而且帮助很大。中而且帮助很大。n当我要去一个陌生的地方,在为当我要去一个陌生的地方,在为乘坐公交发愁乘坐公交发愁时,我会去时,我会去图形天下网站图形天下网站搜索搜索市区地图以及公交换乘方案市区地图以及公交换乘方案;n当我想当我想买一台打印机买一台打印
6、机而无从选择的时候,我会去而无从选择的时候,我会去百度搜索百度搜索合适价位的机型,然后去合适价位的机型,然后去西祠胡同的打印机医院西祠胡同的打印机医院版查看众版查看众网友的评论,从而对其利弊做到心中有数;网友的评论,从而对其利弊做到心中有数;n当我偶然听到当我偶然听到一首好听的歌曲却不知道其名一首好听的歌曲却不知道其名时,我会去百时,我会去百度度MP3MP3,搜索歌词中一两个词语,从而找到歌名并下载;,搜索歌词中一两个词语,从而找到歌名并下载;n毫不夸张地说:毫不夸张地说:信息检索让我在指尖为所欲为!信息检索让我在指尖为所欲为!学生的体会学生的体会11课程类型课程类型:公共选修课学时学时:16
7、学时(课堂讲授10学时,上机实习6学时)教材教材:医学文献检索/郭继军主编北京:人民卫生出版社,2008.6 成绩评定方法成绩评定方法:考勤+作业+实习+考试(60%)课课 程程 介介 绍绍12课程主要内容课程主要内容哪里查找文献信息怎样查找文献信息如何利用文献信息重点重点:第一讲中的基本概念和基本方法;第二至五讲中的检索方法难点难点:各类型数据库、各种搜索引擎的使用方法与技巧;网络信息的筛选与有效利用。13 绪绪 论论(2学时)学时)1 中文医学文献检索中文医学文献检索 (2学时)学时)2 外文医学文献检索外文医学文献检索 (2学时)学时)3 特种文献、引文检索特种文献、引文检索 (2学时)
8、学时)4 网络信息资源检索网络信息资源检索 (2学时)学时)56 实实 习习 (6学时)学时)教教 学学 安安 排排14医学文献的基本概念医学文献的基本概念1文献信息检索基础知文献信息检索基础知识识2计算机信息检索基础知计算机信息检索基础知识识3第一讲15认识文献文献:类型、特点、作用认识检索工具检索工具:构成原理、类型、特点掌握:检索的原理、方法和途径学习目标学习目标16医学文献的基本概念医学文献的基本概念第一节第一节17医学文献的基本概念n1.信息(information)n2.知识(knowledge)n3.情报(information)n4.文献(literature,document
9、)n5.文献检索n6.信息素养18 (Information)n信息信息是事物发出的体现它存在和运动状态的信号和消息。n在人类社会中,信息是以语言、文字、符号、图形、声波、光波、电磁波等形式传递,以纸张、胶片、磁带、光盘等作为纪录知识的载体来表示。信息是不同于物质和能量的一种特殊资源。n医学信息医学信息是对人体生理或病理状态特征的认识及其反映,如人体脉搏、气味及疾病状态下的各种体征与症状。如:腹痛、呕吐、腹泻。信信 息息19 (knowledge)n知识知识:是人们在生活实践中所获得的认识和经验总结。知识来源于信息,是对信息处理后获得的认识。n医学知识属于自然科学范畴,是人们长期与疾病作斗争的
10、经验总结。知知 识识20 (intelligence)n情报情报:是人们在一定的时间内为一定的目的而传递有使用价值的知识或信息。n情报具有三个基本属性:知识性、传递性、效用性。情报情报21n朝鲜战争与兰德咨询公司故事朝鲜战争与兰德咨询公司故事 n在在美美国国出出兵兵朝朝鲜鲜之之前前,美美政政府府曾曾请请美美国国著著名名的的咨咨询询机机构构兰兰德德公公司司做做一一预预测测:如如果果美美国国出出兵兵中中国国会会不不会会出出兵兵?兰兰德德公公司司请请了了大大批批资资深深专专家家,从从中中共共历历史史、军军力力、国国际际关关系系、甚甚至至中中共共领领袖袖性性格格等等各各方方面面做做了了精精深深的的分分
11、析析,最最后后得得出出结结论论是是:“中中国国将将出出兵兵朝朝鲜鲜”。其其主主题题词词只只有有7 7个个字字,要要价价150150万万美美元元。美美国国国国防防部部认认为为是是敲敲诈诈,不不予予理理睬睬,在在自自认认为为中中共共不不敢敢出出兵兵的的假假设设下下,冒冒险险出出兵兵,结结果果“在在错错误误的的时时间间,在在错错误误的的地地点点,与与错错误误的的敌敌人人进进行了一场错误的战争行了一场错误的战争”。n麦麦克克阿阿瑟瑟将将军军:我我们们最最大大的的失失策策是是怀怀疑疑咨咨询询公公司司的的价价值值,舍舍不不得得为为一一条条科科学学的的结结论论付付出出不不到到一一架架战战斗斗机机的的代代价价
12、,结结果果是是我我们们在在朝朝鲜鲜战战场场上上付付出出了了830830亿亿美美元元和和十十多万名士兵的生命。多万名士兵的生命。22 (Literature)n文献文献:记录有知识的一切载体。n文献具有知识、载体、信息符号和记录方式四个要素。n医学文献医学文献(Medical Document):是指将医药卫生知识用文字、图像、符号等媒介记录在特定载体上称之为医学文献。如医学图书、期刊、会议录等。文文 献献23信息、知识、情报与文献之间的关系信息、知识、情报与文献之间的关系:文献与信息、知识、情报之间既有区别又有联系:n信息信息广泛存在与自然界和人类社会,是事物运动状态和运动方式的反映;n知识知
13、识是人们工作生活中的经验总结,是被人们所认识(提炼加工)的一部分信息;n情报情报来源于知识,是指传递给特定用户的知识;n信息、知识、情报都比较抽象,必须通过符号、文字、音频、影像等形式才能表现出来,并利用一定载体加以物化,才能被人们所认识和传播,文献文献就是这种物化了的信息、知识和情报。24信息、知识、情报和文献之间的关系信息、知识、情报和文献之间的关系:信息信息是知识的源泉,知识知识是系统化、理论化的信息,情报情报是活化的知识和信息。文献文献是信息、知识、情报的主要载体形式。信息信息知识知识 文献文献情报情报25n5.文献检索文献检索:就是查找文献信息,即根据特定的需求,以科学的方法利用专门
14、的工具,从大量的文献资料中迅速、准确、完整地查找到文献资料的过程。n6.信息素养信息素养:是指个人“能认识到何时需要信息和有效地检索、评估和使用所需信息的能力”26文献检索基础知识文献检索基础知识第二节第二节27咸宁学院图书馆文献检索教研室 信息检索基础知识 1.医学文献的类型 2.文献信息检索工具 4.医学文献检索的途径 3.医学文献检索的基本方法28一、医学文献的类型 1)按文献的)按文献的载体形式载体形式分类分类2)按文献的)按文献的加工层次加工层次分类分类3)按文献的)按文献的出版形式出版形式分类分类印刷型文献、微缩型文献、印刷型文献、微缩型文献、视听型文献、电子视听型文献、电子型文献
15、型文献一次文献一次文献二次文献二次文献三次文献三次文献零次文献零次文献图书、期刊图书、期刊专利文献专利文献学位论文学位论文会议文献会议文献标准文献标准文献病历资料病历资料内部资料内部资料种种类类29印刷型印刷型纸张纸张-图书、期刊、专利文献等图书、期刊、专利文献等缩微型缩微型感光材料感光材料-缩微胶片、平片、胶卷缩微胶片、平片、胶卷视听型视听型磁带等磁带等-录音带、录像带、电影胶片录音带、录像带、电影胶片电子型电子型磁、光盘磁、光盘-电子期刊、图书、数据库电子期刊、图书、数据库按文献的载体形式分类按文献的载体形式分类30n一次文献一次文献:是以作者本人的工作或科研成果为依据而创作的原始文献。专
16、著专著、期刊论文期刊论文、研究报告研究报告、专利文献专利文献、学位论文学位论文、会议文献会议文献、译译文文等均属一次文献。一次文献是重要的信息源,是产生二、三次文献的基础。n二次文献二次文献:对一次文献进行加工整序而形成的文献。包括目录目录、索引索引和文摘文摘。二次文献就是通常所说的检索工具,是为检索一次文献服务的,也是文献检索课教学的主要内容。n三次文献三次文献:是指在利用二次文献的基础上,选用大量一次文献经过综合分析、整理编辑而成的文献。如词典词典、百科全书百科全书、年鉴年鉴、手册手册、名录名录、综述综述、评论评论、进展进展、动态动态等。n零次文献零次文献:指未经正式发表的原始文献,如个人
17、笔记个人笔记、实验记录实验记录、会议记录会议记录、书信书信等。按文献的按文献的加工层次加工层次分类分类31情报源情报源情报线索情报线索高级情报产物高级情报产物一次文献一次文献二次文献二次文献三次文献三次文献读者查找读者查找读者查找读者查找三次文献之相互关系三次文献之相互关系32判断下列文献各属于什么文献类型:n1、医学索引n2、荷兰医学文摘n3、关于药物治疗高血压的最新进展n4、一封信。n5、百科全书n6、学术论文n7、红楼梦33专利文献专利文献会议文献会议文献特种文献特种文献特种文献特种文献连续出版物连续出版物连续出版物连续出版物期刊期刊报纸报纸专著专著教科书教科书丛书丛书工具书工具书学位论
18、文学位论文标准文献标准文献科技档案科技档案科技报告科技报告产品资料产品资料政府出版物政府出版物图书图书按文献的出版形式分类34按文献出版形式划分 (Book)图书为较系统论述某一专题或学科知识的著述。提供的知识比较全面、系统和成熟。如:教科书、科普读物、专著、参考工具书(词典、百科全书、年鉴、手册、指南等)等。(Periodical、Journal、Magazine)是指具有固定名称、定期或不定期的连续性出版物,每期的版式大致相同。与图书相比,期刊出版周期短、报道速度快、知识新颖、信息量大,能及时反映科学发展水平,从期刊获取的科技资料,占整个情报来源的70%。按内容性质划分有学术性、通讯性、检
19、索性、综述性、科普性期刊。图书期刊35核心期刊 核心期刊指的是刊载与某一学科(或专业)有关的信息核心期刊指的是刊载与某一学科(或专业)有关的信息较多,且水平较高,能够反映该学科最新成果和前沿动态,较多,且水平较高,能够反映该学科最新成果和前沿动态,受到该学科读者特别关注的那些期刊。受到该学科读者特别关注的那些期刊。中文核心期刊中文核心期刊中文核心期刊要目总揽北京大学图书馆 2004年版外文核心期刊外文核心期刊外文核心期刊要目总揽外文核心期刊要目总揽北京大学图书馆北京大学图书馆 20052005年版年版查找查找36n (Special Document)n科技报告科技报告 是关于某项科学研究、技
20、术开发等的报告。特点:有机构名称、统一编号、独立成册、信息准确、时效性强等。n专利文献专利文献 是指专利申报人从申请到审查批准后予以公布的书面文件。主要指专利说明书、专利公报。n会议文献会议文献 是指在会议上宣读、交流的论文,学术报告,会议纪要等文献。n政府出版物政府出版物 指政府及其所属部门发表的文件和报告。n学位论文学位论文 是指博士或硕士研究生所完成的学术性研究论文。n标准文献标准文献 指有关产品和工程的质量、规格、生产过程、检验方法的技术文件。n技术档案技术档案 是指生产、设计、建设和科研等部门,在科技活动中形成的文件、图表、数据等的原始记录文献。n产品资料产品资料 指产品样本、标准、
21、说明书、目录、技术资料等。n其他文献其他文献 如,报纸、内部刊物、通报等。特种特种文献文献咸宁学院图书馆文献检索教研室咸宁学院图书馆文献检索教研室3737各各类类型出版物特点型出版物特点v图书:内容系:内容系统、成熟、可靠,、成熟、可靠,新新颖性稍差性稍差;v期刊期刊:数量大,覆盖面广;内容新:数量大,覆盖面广;内容新颖、及、及时;交流、影响广泛,;交流、影响广泛,信息价信息价值高;高;v专利文献利文献:反映新的技:反映新的技术发明,明,类型有:型有:专利利说明明书、专利公利公报、专利分利分类表、表、专利文摘等利文摘等检索工具;索工具;v学位学位论文文:内容:内容专深,有深,有较高学高学术参考
22、价参考价值;v会会议文献文献:反映最新成果、最新:反映最新成果、最新动向、高水平、前沿向、高水平、前沿发展展动态。会会议论文集、会文集、会议录等;等;v科技科技报告告:反映前沿科技、内容新:反映前沿科技、内容新颖、有密、有密级控制,如美国政控制,如美国政府四大科技府四大科技报告:告:PB、AD、NASA、DOE报告;告;v标准文献准文献:反映成熟技:反映成熟技术,供研制新,供研制新产品、改造老品、改造老产品、改品、改进工工艺和操作水平借和操作水平借鉴;38常用名词术语nISBN:国际标准书号,是专门为识别图书等文献而设计的国际编号。ISBN由10位数字组成,分四个部分:组号(国家、地区、语言的
23、代号),出版者号,书序号和检验码。在图书检索时,ISBN可以作为一个检索途径。例如:ISBN 7-5611-0133-3nISSN:国际标准连续出版物号。采用ISSN编码系统的出版物有:期刊、会议录等。ISSN由8位数字组成,分两个部分(序号,检验码);在联机书目中,ISSN可以作为一个检索字段,为用户增加了一种检索途径。例如:ISSN 1002 -1965nISRC:国际标准音像制品编码。它是音像制品的国际性的唯一标识编码。目前采用ISRC编码的出版物包括唱片、录音带、录像带、激光视盘、激光唱片等。ISRC的实施必将对音像制品的出版发行、版权保护、信息交换和市场管理产生积极的影响。ISRC在
24、联机目录中也可以作为用户的一个检索人口。ISRC由国家码、出版者码、录制年码、记录码和记录项码五个数据段12个字符组成。39二、文献检索工具:累积、存贮文献线索,用于报导文献并提供检索途径的工具书刊工具书刊和数据库数据库(目录目录、文摘文摘、索引索引、全文数据库全文数据库等)。文文献献信信息息检检索索工工具具手工检索工具手工检索工具手工检索工具手工检索工具计算机检索工具计算机检索工具计算机检索工具计算机检索工具参考工具书参考工具书参考工具书参考工具书:字典、词典、百科字典、词典、百科全书、手册、指南、名录、年表、全书、手册、指南、名录、年表、数据、统计资料数据、统计资料 检索工具书检索工具书检
25、索工具书检索工具书:书目、索引书目、索引文摘文摘 数据库数据库 40文献信息检索工具目目录录索索引引(题题录录)文文摘摘参参考考工工具具书书全全文文数数据据库库41检索类型检索类型目录目录索引(题录)索引(题录)文摘文摘含义含义通常是以文献的本、种、件等为单位,对一批相关文献外表特征的揭示和报道。报道和揭示单篇文献的外表特征,是在目录的基础上发展起来的。对文献内容选择重要部分以简练的形式作为摘要,并按一定的原则和方法编排而成的一种检索工具。著录内容著录内容文献名称、著者、出版项与馆藏信息等内容论文题目、著者、文献出处(刊名、发表年月、卷、期、页码)及文种等同 文摘举例举例 全国新书目全国总书目
26、中目、IMCBM,PubMed区别:目录的著录对象是整部文献,题录是文献中的论文或部分内容42n索引(题录)索引(题录)n文摘文摘43文摘主要有四点作用:n帮助判断和选择必读论文。帮助判断和选择必读论文。n节省阅读全文的时间和精力(一般可节约节省阅读全文的时间和精力(一般可节约60%)。)。阅谈了著录较为详细的文摘之后,大体上就阅谈了著录较为详细的文摘之后,大体上就掌握了原文内容要点。掌握了原文内容要点。n消除文种的障碍(消除文种的障碍(IM40多种、多种、CA56种文字)种文字)。因为在一种检索工具中,无论原始文献是什么语种,其因为在一种检索工具中,无论原始文献是什么语种,其文摘都被译为统一
27、的一种语言(一般为英语)文摘都被译为统一的一种语言(一般为英语)n可代替一些无法获得的文献,如马尔尼菲青可代替一些无法获得的文献,如马尔尼菲青霉病。霉病。44国内医学文献检索工具刊简介 国内主要医学文献检索工具刊从出版形式上可分为两大部分:n1.题录式检索工具刊:题录式检索工具刊:中文科技资料目录(医药卫生、中草药)全国报刊索引(科技版)国外科技资料目录(医药卫生)n2.文摘式检索工具刊:文摘式检索工具刊:中国医学文摘 中国药学文摘 中国生物学文摘45国外医学文献检索工具刊简介n美国医学索引(IM)n荷兰医学文摘(EM)n美国生物学文摘(BA)n美国化学文摘(CA)n美国科学引文索引(SCI)
28、46常用文献信息检索工具参考工具书参考工具书n参考工具书参考工具书是一种事实检索工具,汇集一定范围的知识材料,并按一定的形式和方法编排,提供查找某一学科和学术领域的特定资料、基本概念和基本知识的工具书。n其区别于检索工具书的是它提供的不是原始文献的线索,而是事实本身。n参考工具书的类型参考工具书的类型n字词(辞)典,中国药物大辞典中国药物大辞典n百科全书,中国医学百科全书中国医学百科全书n年鉴,中国药学年鉴中国药学年鉴n手册、指南,药物手册药物手册n名录、类书47最常用文献信息检索工具全文数据库全文数据库n中文的有:n 中国知网n 维普资讯资源系统n 万方数据库。n外文的有:nEBSCO数据库
29、n Springer电子全文期刊n Nature电子全文期刊 48三、医学文献检索的基本方法n顺查法:时间上,远远近近 查全率查全率高n倒查法:时间上,近近远远 查准率查准率高n抽查法:研究的高级阶段 检索效率高n追溯法(引文法):一次文献参考文献一次信息参考文献 近近远远n交替法(综合法)49四、医学文献检索的途径n检索途径检索途径又称为检索点、检索入口或检索标识,指用户进行信息检索的出发点和依据,它是由信息的内部特征和外部特征构成的。不同的检索途径,需要采用不同的检索语言进行检索。从文献外表特征查找文献从文献外表特征查找文献 题名途径题名途径 著者途径著者途径 序号途径序号途径 从文献内容
30、特征查找文献从文献内容特征查找文献 分类途径分类途径 主题词途径主题词途径 关键词途径关键词途径50检索途径:n分类途径分类途径:利用分类名和分类号进行检索。特点是检索的系统性强,检全率高。n题名题名(篇名篇名)途径途径:是利用文献题目(篇名)中的名词术语查找文献的途径。查准率高。n主题词主题词/关键词途径关键词途径:利用文章篇首标明的与该篇文献主题相关的词进行检索。查准率高。n著者途径著者途径:利用文献作者名字进行检索。可查到该作者的所有文献。从著者姓名检索文献,简单、直接、查准率高,能在短时间内查找到某学科带头人或权威专家所发表的论文。咸宁学院图书馆文献检索教研室咸宁学院图书馆文献检索教研
31、室 51分类途径 主题途径52n出处途径出处途径:利用原文献刊载处进行检索。可查到某刊载处刊登的所有文献n全文关键词途径全文关键词途径:用于全文数据库检索。利用从文献题名和正文中抽出的、表达文献主题内容的、有实际意义的词进行检索。结果全,但有误检;n全文自由词全文自由词(任意词):用于全文数据库检索。利用文献中的任意字或词进行检索,结果全,但误检率高。n年份途径年份途径:利用年份进行检索。可查到某年份出版的所有文献。一般与其他途径合并使用。咸宁学院图书馆文献检索教研室咸宁学院图书馆文献检索教研室 杨慕莲杨慕莲 20092009年年2 2月月53常用检索途径的检索效率n分类途径分类途径:利用分类
32、名和分类号进行检索。其结果是该类目所有的文献,检索结果较全结果较全。n题名(篇名)途径题名(篇名)途径:利用篇名中的字词或篇名的一部分进行检索。其结果是所有在篇名中出现该字、该词或该部分的文章,检索结果较准结果较准。n主题词主题词/关键词途径关键词途径:利用文章篇首标明的与该篇文献主题相关的词进行检索。其结果是包含该主题词或关键词的所有文献,结果较准结果较准。n著者途径著者途径:利用文献作者名字进行检索。可查到该作者的所有文献。但不系统n出处途径出处途径:利用原文献刊载处进行检索。可查到某刊载处刊登的所有文献n全文关键词途径:用于全文数据库检索。利用从文献题名和正文中抽出的、表达文献主题内容的
33、、有实际意义的词进行检索。结果全,但有误检;结果全,但有误检;n全文自由词全文自由词(任意词):用于全文数据库检索。利用文献中的任意字或词进行检索,结果全,但误检率高结果全,但误检率高。n年份途径年份途径:利用年份进行检索。可查到某年份出版的所有文献。一般与其他途径合并使用。54计算机检索基础知识计算机检索基础知识第三节第三节55一、计算机信息检索的定义56相关概念 n字段(字段(field):是文献著录的基本单元,反映文献的外部特征和内容特征的每一个项目。如在数据库中题名、作者、作者单位、期刊名、摘要、全文等等均是字段;一条记录由多个字段值组成;对计算机检索来说字段相当于检索入口。n记录记录
34、(Record):由若干字段组成的文献单元,在全文数据库中,一条记录相当于一篇完整的文献,在书目数据库中,一条记录相当于一条文摘或题录。n文档文档(File):由若干个逻辑记录构成的信息集合,是数据库的基本内容,分为顺排文档和倒排文档。顺排文挡是数据库的主体内容,倒排文档是将记录中的一切可检字段或属性值提取出来,按某种顺序重新加以组织所得到的文档。n顺排文档(记录)顺排文档(记录)顺排文档(记录)顺排文档(记录)n n倒排文档(索引)倒排文档(索引)倒排文档(索引)倒排文档(索引)n n数据库数据库数据库数据库(database(database)由计算机进行处理的一定数量同类信息的有序集合,
35、是由计算机进行处理的一定数量同类信息的有序集合,是用来存储和查找文献信息的电子化检索工具。用来存储和查找文献信息的电子化检索工具。57常用字段缩写:nTITitle 文章题目文章题目nABAbstract 文章摘要文章摘要nKWKey Word 关键词关键词nAUAuthor 作者作者nAFAffiliation 作者单位作者单位nSOSource 文章来源(刊名信息等)文章来源(刊名信息等)nISSN(ISBN)International standard Serial(book)Number nPYPublication year 出版年出版年nLALanguage 语种语种nPTPubl
36、ication type 文章类型文章类型 58二、计算机信息检索特点n效率高:速度快n检索途径多n适合检索复杂课题n资源可共享,资源更新快n检索结果可直接输出n入手容易,跨越时空的限制59书目数据库书目数据库 书书目目数数据据库库存存储储的的是是二二次次文文献献,包包括括文文献献的的外外部部特特征征、题题录录、文文摘摘和和主主题题词词等等,检检索索结结果果是是所所需需文文献献的的线线索索而而非非原原文文。许许多多书书目目数数据据库库是是印印刷刷型型文文献献检检索索工工具具的的机机度度版版,如如MEDLINEMEDLINE、CBMDISCCBMDISC等书目数据库是计算机文献检索最常用的数据库
37、类型。等书目数据库是计算机文献检索最常用的数据库类型。数值数据库数值数据库 主要包含的是数字数据,如各种统计数据、科学实验数据、科学测量数据等。主要包含的是数字数据,如各种统计数据、科学实验数据、科学测量数据等。例如医学上使用的化学制剂、药物的各种理化参数、人体生理上的各种数值,人口例如医学上使用的化学制剂、药物的各种理化参数、人体生理上的各种数值,人口统计数据都可收入数值数据库。统计数据都可收入数值数据库。事实数据库事实数据库 存储的是用来描述人物、机构、事物等信息的情况、过程、现象的事实数据。存储的是用来描述人物、机构、事物等信息的情况、过程、现象的事实数据。如名人录、机构指南、大事记等,
38、均可归入事实数据库。如名人录、机构指南、大事记等,均可归入事实数据库。美国美国MEDLARSMEDLARS系统的医生咨询数据库(系统的医生咨询数据库(PDQPDQ),能提供有关癌症治疗和临床实验的相),能提供有关癌症治疗和临床实验的相关病因、诊断标准、治疗方案以及最新研究进展等信息。关病因、诊断标准、治疗方案以及最新研究进展等信息。三、数据库的类型60n查找某概念的确切含义某概念的确切含义 如:什么是“blog”n查找某概念的背景知识某概念的背景知识 如:谁最先发现青霉素n查找某些事物的数值及量化指标某些事物的数值及量化指标 数值数据库数值数据库事实数据库事实数据库61n存储的是原始文献的全文
39、,如杂志论文、报纸新闻、法院案例等。n全文检索可直接获取原始资料,而不是书目检索时的线索,提高了用户的检索效率。n中国期刊全文数据库(清华同方)n中文科技期刊全文数据库(重庆维普)n数字化期刊全文数据库(万方数据)n书生之家、超星数字图书馆的全文图书n是目前高校利用率较高的学术资源。全文数据库全文数据库62四、计算机信息检索技术n布尔逻辑检索n截词检索n位置运算检索n字段限定检索n精确检索与模糊检索63n在检索过程中用于表达词于词之间的逻辑关系的算符就称为布尔逻辑运算符。n分为三种逻辑关系:逻辑与、逻辑或、逻辑非。n逻辑“与与”:用“AND”或“*”表示。用于连接概念交叉和限定关系的检索词。n
40、逻辑“或或”:用“OR”或“+”表示。用于连接并列关系的检索词。n逻辑“非非”:用“NOT”或“-”号表示,。布尔逻辑检索布尔逻辑检索 逻辑“与”逻辑“或”逻辑“非”64布尔逻辑示意图布尔逻辑示意图运算符:运算符:AND起起缩小缩小检索范围,提检索范围,提高查准率的作用。高查准率的作用。运算符:运算符:OR起起扩大扩大检索范围,提检索范围,提高查全率的作用。高查全率的作用。运算符:运算符:NOT起起缩小缩小检索范围,用检索范围,用于去除检出文献中不于去除检出文献中不需要的部分。需要的部分。逻辑与逻辑与逻辑或逻辑或逻辑非逻辑非65逻辑与、逻辑或、逻辑非检索式构造举例n如:查找“胰岛素治疗糖尿病胰
41、岛素治疗糖尿病”的检索式为:胰岛素 and 糖尿病 insulin and diabetesn如:查找“肿瘤”的检索式为:cancer(癌)or tumor(瘤)or carcinoma(癌)or neoplasm(新生物)n如:查找“动物的乙肝病毒动物的乙肝病毒(不要人的)”的文献的检索式为:hepatitis B virus(乙肝病毒)not human(人类)n数据挖掘在信息检索与信息分析中的应用数据挖掘在信息检索与信息分析中的应用数据挖掘*(信息检索+信息分析)66举例n检索关于欧洲金融方面的新闻n检索能源但不涉及核能方面的文献欧洲andand金融andand(新闻or or报道)能源
42、notnot核能67截词检索截词检索n截词检索就是把检索词截断,取其中的一部分,在加上截词符号一起进行检索n主要用于检索词的单复数、词性的词尾变化、词根相同的一类词n以及同一词的拼法变异等n通用的截词符有:?和*n?代表零或一个字母;*代表两个或两个以上字母n举例:Child*可代表child,children,childly,childhood,等等Colo?r可检索出color,colourDra?t可检索出drat,draft,draught,等等68位置运算检索位置运算检索n用邻近运算符连接两个检索词,表示要求两个检索词同时出现在同一记录中n两词的相互位置必须符合规定的相邻度才能被命中
43、检出。n邻近运算符:in、with、nearnin:指定在某个字段进行检索nwith:连接两个词检索,凡是在同一记录的同一字段中出现两个词nnear:两个词在同一个句子中出现69字段限制检索字段限制检索n字段限制检索即指定检索词出现的字段,被指定的字段也称检索入口,检索时,系统只对指定字段进行匹配运算,提高了效率和查准率。在数据库中,字段名称通常放置在下拉菜单中。西文数据库,字段检索常用代码来表示,如下表所示。70n模糊检索是与“精准检索”相对应的一个概念,是指搜索系统自动按照用户输入关键词的同义词进行模糊检索,从而得出较多的检索结果。n精确检索是指检索词与检索字符串完全相等。n如检索作者马智
44、,仅检索出作者为马智的文献,作者为“马智勇”的就不会被检索出来。精确检索与模糊检索精确检索与模糊检索71五、检索策略n检索策略是指为实现文献查全查全、查准查准这些目标而制定的方案,这些方案包括:合理选择数据库 灵活选用检索途径 正确编写检索式72六、医学文献检索的步骤分析课题,明确检索需求分析课题,明确检索需求选择数据库和检索途径选择数据库和检索途径确定检索标识,构筑检索提问式确定检索标识,构筑检索提问式输入计算机输入计算机浏览检索结果浏览检索结果选出满意的结果选出满意的结果获取全文获取全文73分析检索课题,明确检索要求1.检索的目的和范围:分析课题即:明确所检课题的学科范围学科范围、所需文献
45、类型文献类型(期刊论文、专利文献、学位论文)、文种及检索年限年限等。2.检索内容主题分析:主要概念及相互关系,隐含概念和核心概念分析课题时须注意的问题:要从概念入手,而不是从字面意思入手;当课题比较生疏时,应当首先利用百科全书、图书等弄清楚概念,进而确定检索的主题范围。忽略那些意义过于宽泛,通用的词,比如:“研究”、应用”、“探讨”等74选择检索系统和数据库应注意以下几点:应注意以下几点:1数据库收录的文献内容:全2.文献报道数量要大2数据库收录的文献的出版类型3数据库中收录文献的时间范围4数据库的更新情况75机检用数据库n1.中文科技期刊全文数据库(维普)1989-现在n2.万方数字化期刊
46、1986-现在n3.中国期刊全文数据库(CNKI)1979-现在n4.中国优秀博硕士学位论文全文数据库(同方)1999-现在n5.中国学位论文全文数据库(万方)1977-现在n6.中国学术会议论文全文数据库(万方)1995-现在n7.中国重要会议论文全文数据库(同方)2000-现在n8.中国重大科技成果数据库(万方)1990-现在76各类文献数据库常用检索途径检索途径检索途径:是指检索文献的出发点及路线分类分类途径:以文献分类为检索入口主题主题途径:以文献中涉及的主题词为检索入口(查准率高,选准主题词)著者著者途径:以文献著者姓名为检索标目;题名题名途径:以文献的名称(书名、刊名、论文题名)为
47、检索标目。77信息检索途径信息检索途径1 题名(题目、标题等)途径题名(题目、标题等)途径2 责任者(作者、编者等)途径责任者(作者、编者等)途径3 序号(序号(ISBN号等)途径号等)途径4 分类途径分类途径5 主题途径(主题词)主题途径(主题词)6 关键词途径关键词途径ISBN是国际标准书号(是国际标准书号(International Standard Book Number)的)的简称,是国际通用的图书或独立的出版物(除定期出版的期刊)代码。出版社可以通过国际标准书号清晰的辨认所有非期刊书籍。一个国际标准书号只有一个或一份相应的出版物与之对应。ISSN(国际标准连续出版物编国际标准连续出
48、版物编号号,International Standard Serial Number)是根据国际标准ISO3297制定的连续出版物国际标准编码,其目的是使世界上每一种不同题名、不同版本的连续出版物都有一个国际性的唯一代码标识。78检索表达式用运算符运算符将检索词检索词连接起来构成的能让计算机识别的式子检索表达式可以是一个检索词或者是一个逻辑表达式。简单的检索只要输入一个检索词即可,复杂的检索则需要输入检索表达式。将多个检索词用布尔运算符组合在一起来进行检索,我们称之为布尔逻辑检索。运算符和检索词运算符和检索词是构成检索式的是构成检索式的关键关键79确定检索词确定检索词什么是检索词?检索词必须反
49、映课题内容和信息需求;如有主题词表,要优先选用;自由词还需选取该词的同义词、近义词、上位词、下位词等检索词是从课题中提炼出的能够反映课题内容和信息需求的,具有检索价值的基本名词或术语。主题:在些特指文献主题,即文献所论述和涉及的主要事物和对象;主题词:是指用于描述、存储、查找文献主题的词汇。在我国一般称为主题词。主题词表:是主题词按照一定方式组织并显示词间关系的词汇表,是文献标引和检索的工具。80共同危险行为疑难问题研究论我国诉讼时效制度的完善网络条件下的隐私权保护问题 黄金周的宪法思考用词语切分法确定下列题目中的检索词用词语切分法确定下列题目中的检索词论英美法系国家判例法的适用 英美法系/判
50、例法/适用按照概念单元概念单元概念单元概念单元分成不能再拆分的词语“研究”“展望”“现状”“应用”“建立”“影响”“实施”去掉题目中的虚词和泛指的词语去掉题目中的虚词和泛指的词语81检索结果分析目前普遍采用查全率和查准率来衡量(评价)检索结果对用户文献需求的满足程度。查全率查全率是指系统在进行某一检索时,检出的相关文献量与系统文献库中相关文献总量的比率,它反映该系统文献库中实有的相关文献量在多大程度上被检索出来。查准率查准率是指系统在进行某一检索时,检出的相关文献量与检出文献总量的比率,它反映每次从该系统文献库中实际检出的全部文献中有多少是相关的。82扩大检索范围,提高扩大检索范围,提高扩大检