《第三章信息检索工具精选文档.ppt》由会员分享,可在线阅读,更多相关《第三章信息检索工具精选文档.ppt(29页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第三章信息检索工具本讲稿第一页,共二十九页一、检索工具的特性一、检索工具的特性1 什么是检索工具?什么是检索工具?检索工具是用来报道、存储、查找信息检索工具是用来报道、存储、查找信息 的工具。的工具。检索工具是汇辑各种信息,按特定的方检索工具是汇辑各种信息,按特定的方 法加以描述和编排,以供查考的工具。法加以描述和编排,以供查考的工具。本讲稿第二页,共二十九页检索工具与普通文献的主要区别在于:检索工具与普通文献的主要区别在于:它是一种工具书刊,是专供人们查找特它是一种工具书刊,是专供人们查找特定信息的,虽然它也具备可读性,但它定信息的,虽然它也具备可读性,但它不是供人们进行系统阅读的。不是供人
2、们进行系统阅读的。本讲稿第三页,共二十九页2 检索工具的特点检索工具的特点1 编排特殊,便于查检编排特殊,便于查检2 信息密度大信息密度大3 概括性强概括性强本讲稿第四页,共二十九页二、检索工具的类型二、检索工具的类型1 按出版形式分:按出版形式分:(1)期刊式检索工具)期刊式检索工具(2)书本式检索工具)书本式检索工具(3)附录式检索工具)附录式检索工具(4)卡片式检索工具)卡片式检索工具(5)缩微式检索工具)缩微式检索工具(6)机读式检索工具)机读式检索工具本讲稿第五页,共二十九页2 按检索工具的基本作用划分:按检索工具的基本作用划分:(1)题录型)题录型 (2)参考型)参考型 (3)综合
3、型)综合型 (4)搜索引擎)搜索引擎3 按检索工具的内容与功用划分:按检索工具的内容与功用划分:(1)目录()目录(2)索引()索引(3)文摘)文摘 (4)辞典()辞典(5)百科全书(百科全书(6)年鉴)年鉴 (7)手册()手册(8)名录)名录 (9)表谱)表谱 (10)图谱()图谱(11)类书()类书(12)政书)政书本讲稿第六页,共二十九页目录目录:是著录一批相关的出版物,并按一定方式编:是著录一批相关的出版物,并按一定方式编 排的一种揭示与报道信息的工具。排的一种揭示与报道信息的工具。国家书目、在版目录、期刊目录、收藏目录、国家书目、在版目录、期刊目录、收藏目录、联合目录、推荐书目、专题
4、书目。联合目录、推荐书目、专题书目。索引:索引:是将出版物中只有检索意义的信息特征是将出版物中只有检索意义的信息特征(篇篇 名、语词、人名,地名等名、语词、人名,地名等),按一定的顺序,按一定的顺序 编排组织起来,以供检索之用的工具。编排组织起来,以供检索之用的工具。篇目索引篇目索引 内容索引(内容索引(语词索引、主题索引、人名索引、语词索引、主题索引、人名索引、地名索引、关键词索引)地名索引、关键词索引)文摘:文摘:是索引的延伸。是索引的延伸。本讲稿第七页,共二十九页辞典:辞典:字典、词典的总称。字典、词典的总称。字典是解释字的形、音、义及其用法的工具。字典是解释字的形、音、义及其用法的工具
5、。词典是说明语词的定义、意义和用法的工具。词典是说明语词的定义、意义和用法的工具。百科全书:百科全书:是记载人类一切门类的或某一门类的知是记载人类一切门类的或某一门类的知识,以辞典的形式编纂的系统而完备的检索工具。识,以辞典的形式编纂的系统而完备的检索工具。年鉴:年鉴:汇集一年内的重要时事和统计等信息,按汇集一年内的重要时事和统计等信息,按 年年度连续出版的检索工具。度连续出版的检索工具。手册:手册:是汇辑某一领域中最经常使用的信息以备查检是汇辑某一领域中最经常使用的信息以备查检的工具。的工具。名录:名录:亦称机构名录、机构指南、便览、大全,是亦称机构名录、机构指南、便览、大全,是一种系统编排
6、的,有关个人和组织机构的目录。一种系统编排的,有关个人和组织机构的目录。本讲稿第八页,共二十九页表谱:表谱:是以编年或表格形式记载事物发展的检索工具。是以编年或表格形式记载事物发展的检索工具。主要有年表、历表和其它表谱,主要用于查检不同纪主要有年表、历表和其它表谱,主要用于查检不同纪年方法的年代对照,不同历法的年月日对照以及历史年方法的年代对照,不同历法的年月日对照以及历史大事、人物生卒年、地理沿革等信息大事、人物生卒年、地理沿革等信息。图谱:图谱:主要指地图和图录主要指地图和图录地图是根据一定的数学法则和光学技术,将地球地图是根据一定的数学法则和光学技术,将地球表面的自然和社会现象,以各种不
7、同的图式符号表面的自然和社会现象,以各种不同的图式符号在平面纸上缩小成概括的图形。包括普通地图。在平面纸上缩小成概括的图形。包括普通地图。历史地图、专题地图历史地图、专题地图。图录是以图象表示事物形象的工具。有历史图录、图录是以图象表示事物形象的工具。有历史图录、人物图录、艺术图录。人物图录、艺术图录。本讲稿第九页,共二十九页类书:类书:采集各种古籍中有关事物的资料,将它分类编采集各种古籍中有关事物的资料,将它分类编排,以供查阅的工具。类书是中国古代的百科全书。排,以供查阅的工具。类书是中国古代的百科全书。类书主要可用来检索中国古代的诗赋文章、丽词骈语、类书主要可用来检索中国古代的诗赋文章、丽
8、词骈语、史实典故、名物制度等百科资料。史实典故、名物制度等百科资料。太平御览太平御览 册府元龟太平广记文苑英华册府元龟太平广记文苑英华 永乐大典古今图书集成永乐大典古今图书集成 佩文韵府骈字类编佩文韵府骈字类编 政书:政书:中国古代专门记载典章制度的书,它记载典章中国古代专门记载典章制度的书,它记载典章制度的基本内容及其沿革变化和其它史实。制度的基本内容及其沿革变化和其它史实。“十通十通”:通典通志文献通考:通典通志文献通考 续通典续通志续文献通考续通典续通志续文献通考 清朝通典清朝通志清朝文献通考清朝通典清朝通志清朝文献通考 清朝续文献通考清朝续文献通考本讲稿第十页,共二十九页三、检索工具的
9、一般结构三、检索工具的一般结构1 正文部分正文部分2 文前栏目文前栏目3 索引索引4 附录附录本讲稿第十一页,共二十九页四、检索工具的排检方法四、检索工具的排检方法按字顺编排按字顺编排拉丁文字顺排检法拉丁文字顺排检法中文字顺排检法中文字顺排检法按内容性质编排按内容性质编排分类编排分类编排主题编排主题编排本讲稿第十二页,共二十九页拉丁文字顺排检法拉丁文字顺排检法word by wordletter by letter中文字顺排检法中文字顺排检法音序法音序法形序法形序法号码法号码法本讲稿第十三页,共二十九页中文字顺排检法中文字顺排检法音序法音序法汉语拼音排检法汉语拼音排检法注音字母排检法注音字母排
10、检法声部韵部排检法声部韵部排检法形序法形序法笔画法笔画法笔顺法笔顺法部首法部首法号码法号码法四角号码法四角号码法中国字庋撷法中国字庋撷法起笔笔形代码法起笔笔形代码法本讲稿第十四页,共二十九页汉语拼音排检法汉语拼音排检法优点:原理简单、查检迅速;科学性强,符合优点:原理简单、查检迅速;科学性强,符合 国际上检索工具的编排规则,是一种理国际上检索工具的编排规则,是一种理 想的中文排检法。想的中文排检法。缺点:当不知道一个字的正确读音时,就难以缺点:当不知道一个字的正确读音时,就难以 查到。查到。本讲稿第十五页,共二十九页笔画法笔画法优点:原理简单,易于掌握,又适合汉字的特点。优点:原理简单,易于掌
11、握,又适合汉字的特点。局限性:同一笔画容纳的汉字较多,不便很快查到要局限性:同一笔画容纳的汉字较多,不便很快查到要 查检的汉字;由于汉字结构的多样化,简体与查检的汉字;由于汉字结构的多样化,简体与 繁体,规范书写与手写体的差别很大,每个字繁体,规范书写与手写体的差别很大,每个字 的笔画不易计算准确。的笔画不易计算准确。应用:不仅可以用来编排检索工具的正文,也可以用应用:不仅可以用来编排检索工具的正文,也可以用 来编制检索工具的索引,同时它还是一种常见的来编制检索工具的索引,同时它还是一种常见的 补充编排法,音序法、部首法、笔形法等往往用补充编排法,音序法、部首法、笔形法等往往用 它对条目进一步
12、编排。它对条目进一步编排。本讲稿第十六页,共二十九页起笔笔形法起笔笔形法起笔顺序:寒来暑往、江山千古、元亨利贞。起笔顺序:寒来暑往、江山千古、元亨利贞。优点:起笔笔形法强调起笔,位置固定。优点:起笔笔形法强调起笔,位置固定。缺点:每一类所统属的条目多,检索不便。缺点:每一类所统属的条目多,检索不便。应用:起笔笔形法一般不用来编排检索工具的应用:起笔笔形法一般不用来编排检索工具的 正文,多数检索工具仅用它作为其它编排正文,多数检索工具仅用它作为其它编排 方法的一种补充手段,是其它编排方法的方法的一种补充手段,是其它编排方法的 附属方法。附属方法。本讲稿第十七页,共二十九页部首法部首法优点:优点:
13、(1)部首法符合汉字的结构和人们的查找部首法符合汉字的结构和人们的查找 习惯,不认识的字,念不出来,不能习惯,不认识的字,念不出来,不能 用音序查检时,可以根据字形用部首法用音序查检时,可以根据字形用部首法 查出来;查出来;(2)部首法能够容纳数量庞大的汉字,是编部首法能够容纳数量庞大的汉字,是编 制大型语言工具的必要排检法。制大型语言工具的必要排检法。局限:部首的位置不固定,判断一个字的部首局限:部首的位置不固定,判断一个字的部首 必须遵循固定的原则和规定,比较难掌握;必须遵循固定的原则和规定,比较难掌握;不同检索工具中的部首数量往往不同。不同检索工具中的部首数量往往不同。本讲稿第十八页,共
14、二十九页部首法的取部规则部首法的取部规则部首法的取部规则部首法的取部规则从义归部从义归部从形归部从形归部辞海辞海的取部规则的取部规则部首的位置:一个字的部首在字的上、下、左、右、部首的位置:一个字的部首在字的上、下、左、右、外、中坐、左上角。外、中坐、左上角。多部首的取部原则:上、下;左、右;内、外;中坐、多部首的取部原则:上、下;左、右;内、外;中坐、左上角;下、左上角;右、左上角;多笔与少笔叠合;左上角;下、左上角;右、左上角;多笔与少笔叠合;单笔部首和复笔部首。单笔部首和复笔部首。部首无从采取,按横、竖、撇、点、折起笔笔形查单部首无从采取,按横、竖、撇、点、折起笔笔形查单笔部首笔部首本讲
15、稿第十九页,共二十九页四角号码法四角号码法基本规则基本规则 笔形规则:确定用什么号码来代替何种笔形的规则;笔形规则:确定用什么号码来代替何种笔形的规则;取角规则:是关于汉字四角取笔的一些特殊问题的具取角规则:是关于汉字四角取笔的一些特殊问题的具体规定。体规定。优点优点 四角号码法是一种单一的排检法,不必与其它方法相四角号码法是一种单一的排检法,不必与其它方法相结合,只要熟记十种笔形所代表的号码,见字知号,结合,只要熟记十种笔形所代表的号码,见字知号,查检迅速。查检迅速。缺点缺点 四角号码法的局限在于不易准确掌握。四角号码法的局限在于不易准确掌握。本讲稿第二十页,共二十九页四角号码法四角号码法
16、规则规则笔形规则笔形规则:横横1垂垂23点捺,叉点捺,叉4插插5方块方块6,7角角8八八9是小,是小,点下有横变零头。点下有横变零头。取角规则:取角规则:(1)取角顺序;取角顺序;(2)一笔可以分角取号;一笔可以分角取号;(3)一一个笔形,前角用过了,后角作个笔形,前角用过了,后角作0;(4)一笔的上下两段和一笔的上下两段和别笔构成两种笔形的,分两角取号;别笔构成两种笔形的,分两角取号;(5)下角笔形偏在一下角笔形偏在一角的按实际位置取号,缺角作角的按实际位置取号,缺角作0;(6)凡外围是凡外围是“口门口门”的的字,左右两下角取内部笔形;字,左右两下角取内部笔形;(7)当中起笔的撇,下角有当中
17、起笔的撇,下角有它笔的,取它笔作下角;它笔的,取它笔作下角;(8)如果一个角上有两个单笔或如果一个角上有两个单笔或一个单笔和一个复笔可取时,不论高低,只看左右;一个单笔和一个复笔可取时,不论高低,只看左右;(9)如果一个角上有两个复笔可取时,不管左右,只看高低如果一个角上有两个复笔可取时,不管左右,只看高低,(10)取一个字的右下角上方最贴近的笔形作附角。取一个字的右下角上方最贴近的笔形作附角。本讲稿第二十一页,共二十九页分类排检法分类排检法分类排检法是按信息内容的学科属性和逻辑次序编排分类排检法是按信息内容的学科属性和逻辑次序编排检索工具的一种方法分类排检法大致可分为两类;检索工具的一种方法
18、分类排检法大致可分为两类;一是按分类法编排,二是按自编的分类体系编排一是按分类法编排,二是按自编的分类体系编排使使用用分分类类排排检检法法便便于于按按类类检检索索信信息息,并并且且能能够够 较较全全面面地获得同类的相关信息,有利于族性检索地获得同类的相关信息,有利于族性检索本讲稿第二十二页,共二十九页Yahoo!的类目体系的类目体系Yahoo!是以网络资源为对象的指南型分类检索工具,是以网络资源为对象的指南型分类检索工具,它设置了它设置了 14个基本大类,按英文字顺排列:个基本大类,按英文字顺排列:艺术与人文、商业与经济、计算机与网络、教育、艺术与人文、商业与经济、计算机与网络、教育、娱乐、政
19、府、健康与医药、新闻与媒体、休闲与运动、娱乐、政府、健康与医药、新闻与媒体、休闲与运动、参考资料、地区、科学、社会科学、社会与文化参考资料、地区、科学、社会科学、社会与文化本讲稿第二十三页,共二十九页Yahoo!的类目体系的类目体系特点特点(1)从类目设置的角度看,基本放弃了文献分类法以学科为从类目设置的角度看,基本放弃了文献分类法以学科为中心建立类目体系的传统,采用以主题为中心并与学科中心建立类目体系的传统,采用以主题为中心并与学科结合的设类方式,可以使其在具有直接性的同时增加包结合的设类方式,可以使其在具有直接性的同时增加包容性。容性。(2)类目体系的展开,采用了多重划分、多元展开的类目结
20、构,类目体系的展开,采用了多重划分、多元展开的类目结构,收录有关该类的所有信息资源,使用户可以同时从不同角收录有关该类的所有信息资源,使用户可以同时从不同角度出发进行查找。度出发进行查找。(3)采用链接的方式充分揭示横向联系。采用链接的方式充分揭示横向联系。本讲稿第二十四页,共二十九页Yahoo!的类目体系的类目体系不足不足(1)类目的展开缺乏统一的标准,随意性大,无规律可寻;类目的展开缺乏统一的标准,随意性大,无规律可寻;(2)同位类中包括不同等级的类目;同位类中包括不同等级的类目;(3)按照类名字顺排序不能反映并列类目之间的联系,缺乏对按照类名字顺排序不能反映并列类目之间的联系,缺乏对知识
21、门类系统显示的能力。知识门类系统显示的能力。本讲稿第二十五页,共二十九页Sohou分类目录的类目体系分类目录的类目体系娱乐休闲、工商经济、公司企业、文学、体育健娱乐休闲、工商经济、公司企业、文学、体育健身、卫生健康、生活服务、社会文化、社会科学、身、卫生健康、生活服务、社会文化、社会科学、国家地区、电脑网络、教育培训、艺术、新闻媒国家地区、电脑网络、教育培训、艺术、新闻媒介、科学技术、旅游交通、政法军事、个人主页介、科学技术、旅游交通、政法军事、个人主页本讲稿第二十六页,共二十九页主题排检法主题排检法主题排检法是以主题词来揭示,标引和排列信息主题排检法是以主题词来揭示,标引和排列信息的一种方法
22、。用主题法编排检索工具,其过程分的一种方法。用主题法编排检索工具,其过程分两步:一是用能够描述表达信息内容的主题词作两步:一是用能够描述表达信息内容的主题词作为条目的标识,二是将所有条目的标识按字顺组为条目的标识,二是将所有条目的标识按字顺组织起来,织起来,主题排检法能够把不同学科,不同知识体系中的同一主题排检法能够把不同学科,不同知识体系中的同一主题的信息集中在一起,有利于人们按主题检索,但主题的信息集中在一起,有利于人们按主题检索,但使用主题编排的检索工具必须正确选定主题词。使用主题编排的检索工具必须正确选定主题词。本讲稿第二十七页,共二十九页主题编排与分类编排的区别主题编排与分类编排的区
23、别(1)主主题题法法直直接接用用主主题题词词来来描描述述、标标引引和和组组织织信信息息,强强调调“直直观观性性”;分类法则按知识体系分类归并信息,强调;分类法则按知识体系分类归并信息,强调“系统性系统性”。(2)在在主主题题排排检检法法中中,主主题题词词既既揭揭示示信信息息的的内内容容,又又是是用用来来标标引引和和检检索索的的词词汇汇;而而在在分分类类排排检检中中,类类目目只只是是对对信信息息条目学科属性的概括,而不是标引、检索的词汇。条目学科属性的概括,而不是标引、检索的词汇。(3)主主题题排排检检法法需需要要借借助助于于字字顺顺排排检检法法来来编编排排组组织织主主题题词词的的顺顺序序;而而分分类类排排检检法法本本身身不不需需要要借借助助于于其其它它方方法法,它它是是按按信信息息内内容容逐逐级级类类分人类知识。分人类知识。本讲稿第二十八页,共二十九页五、检索工具的评价五、检索工具的评价1 内容范围:全面、丰富内容范围:全面、丰富2 编排技术:正文、索引、版式编排技术:正文、索引、版式3 实效性:获得版权的时间实效性:获得版权的时间4 权威性:出版者、编者权威性:出版者、编者本讲稿第二十九页,共二十九页