《计算机检索技术概述.ppt》由会员分享,可在线阅读,更多相关《计算机检索技术概述.ppt(53页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第四讲计算机检索技术概述计算机检索技术概述3.1 3.1 计算机检索简况计算机检索简况3.2 3.2 计算机检索的相关概念计算机检索的相关概念3.3 3.3 检索式的拟订检索式的拟订3.4 3.4 检索步骤检索步骤3.1 3.1 计算机检索简况计算机检索简况 计算机检索指利用计算机及相关设备进行的文献信息检计算机检索指利用计算机及相关设备进行的文献信息检计算机检索指利用计算机及相关设备进行的文献信息检计算机检索指利用计算机及相关设备进行的文献信息检索。索。索。索。信息检索技术正向两个方向迅速发展:信息检索技术正向两个方向迅速发展:信息检索技术正向两个方向迅速发展:信息检索技术正向两个方向迅速发
2、展:一是在深度上提高管理和组织信息的能力一是在深度上提高管理和组织信息的能力一是在深度上提高管理和组织信息的能力一是在深度上提高管理和组织信息的能力 传统信息检索向全文文本、多媒体、多载体、多原理等传统信息检索向全文文本、多媒体、多载体、多原理等传统信息检索向全文文本、多媒体、多载体、多原理等传统信息检索向全文文本、多媒体、多载体、多原理等新型信息检索的发展新型信息检索的发展新型信息检索的发展新型信息检索的发展.二是在广度上提高管理和组织信息的能力二是在广度上提高管理和组织信息的能力二是在广度上提高管理和组织信息的能力二是在广度上提高管理和组织信息的能力 文献资源的网络化和分布化,面向文献资源
3、的网络化和分布化,面向文献资源的网络化和分布化,面向文献资源的网络化和分布化,面向InternetInternetInternetInternet中浩瀚无垠中浩瀚无垠中浩瀚无垠中浩瀚无垠的资源。的资源。的资源。的资源。1 1 1 1检索系统检索系统检索系统检索系统 信息检索系统包括两个子系统:存储子系统和检信息检索系统包括两个子系统:存储子系统和检信息检索系统包括两个子系统:存储子系统和检信息检索系统包括两个子系统:存储子系统和检索子系统。索子系统。索子系统。索子系统。2 2 2 2联机检索联机检索联机检索联机检索 利用与检索系统或信息中心的主机连接,在中央利用与检索系统或信息中心的主机连接,
4、在中央利用与检索系统或信息中心的主机连接,在中央利用与检索系统或信息中心的主机连接,在中央处理机控制下查询系统内的数据库,并能够与系统处理机控制下查询系统内的数据库,并能够与系统处理机控制下查询系统内的数据库,并能够与系统处理机控制下查询系统内的数据库,并能够与系统实时对话,随时调整检索策略。实时对话,随时调整检索策略。实时对话,随时调整检索策略。实时对话,随时调整检索策略。3 3 3 3数据库数据库数据库数据库 是在计算机存储设备上按一定方式存储的相互关是在计算机存储设备上按一定方式存储的相互关是在计算机存储设备上按一定方式存储的相互关是在计算机存储设备上按一定方式存储的相互关联的数据集合。
5、联的数据集合。联的数据集合。联的数据集合。3.2 3.2 计算机检索的相关概念计算机检索的相关概念字段(字段(field)field):如在数据库中题名、作者、作者单位、期刊名、摘要、全文等等均是字段;一条记录由多个字段值组成;对计算机检索来说字段相当于检索入口。字段(字段(字段(字段(FieldField)记录(记录(记录(记录(RecordRecord)文档文档文档文档(FileFile)数据库数据库数据库数据库 常用字段缩写:常用字段缩写:TITitle TITitle 文章题目文章题目ABAbstract ABAbstract 文章摘要文章摘要KWKey Word KWKey Word
6、 关键词关键词AUAuthor AUAuthor 作者作者AFAffiliation AFAffiliation 作者单位作者单位SOSource SOSource 文章来源(刊名信息等)文章来源(刊名信息等)ISSN(ISBN)International standard Serial(book)Number ISSN(ISBN)International standard Serial(book)Number PYPublication year PYPublication year 出版年出版年LALanguage LALanguage 语种语种记录记录记录记录(Record)(Reco
7、rd)(Record)(Record)由若干字段组成的文献单元,在由若干字段组成的文献单元,在全文数据库中,一条记录相当于一篇完整的文献,全文数据库中,一条记录相当于一篇完整的文献,在书目数据库中,一条记录相当于一条文摘或题录。在书目数据库中,一条记录相当于一条文摘或题录。文档文档文档文档(File)(File)(File)(File)由若干个逻辑记录构成的信息集合,由若干个逻辑记录构成的信息集合,是数据库的基本内容,分为顺排文档和倒排文档。是数据库的基本内容,分为顺排文档和倒排文档。顺排文挡是数据库的主体内容,倒排文档是将记录顺排文挡是数据库的主体内容,倒排文档是将记录中的一切可检字段或属性
8、值提取出来,按某种顺序中的一切可检字段或属性值提取出来,按某种顺序重新加以组织所得到的文档。重新加以组织所得到的文档。顺排文档(记录)顺排文档(记录)顺排文档(记录)顺排文档(记录)倒排文档(索引)倒排文档(索引)倒排文档(索引)倒排文档(索引)数据库数据库数据库数据库(database(database(database(database)由计算机进行处理的一定数由计算机进行处理的一定数量同类信息的有序集合,是用来存储和查找文献信量同类信息的有序集合,是用来存储和查找文献信息的电子化检索工具。息的电子化检索工具。数据库的类型数据库的类型书目数据库全文数据库文摘数据库按信息处理层次划分期刊论文
9、数据库书目及图书全文数据库专利数据库学位论文数据库产品数据库按收录的文献类型划分图像数据库 文本数据库数值数据库 声音数据库 视频数据库多媒体数据库按媒体信息划分综合性数据库专业性数据库按收录文献信息的范围划分单机数据库联机数据库网络数据库按服务模式划分3.3 检索式的拟订布尔逻辑检索算符布尔逻辑检索算符 位置检索算符位置检索算符截词检索算符截词检索算符字段揭示及限制算符字段揭示及限制算符其它符号其它符号注意事项注意事项精精确确与与模模糊糊检检索索 基本技术基本技术词间位置检索词间位置检索 加加权权检检索索 布尔逻辑检布尔逻辑检索索 限定字段检索限定字段检索 限定范围检索限定范围检索 截词检索
10、截词检索 1.1.逻辑逻辑“与与”(AND)”(AND),表示为,表示为 A and B A and B 或或 A*A*B B 2.2.逻辑逻辑“或或”(OR)”(OR),表示为,表示为 A or B A or B 或或 A+B A+B 3.3.逻辑逻辑“非非”(NOT)”(NOT),表示为,表示为 A not B A not B 或或 A-B A-B 3.3.1 3.3.1 布尔逻辑检索算符布尔逻辑检索算符 逻辑逻辑逻辑逻辑“与与与与”用用“and”“and”、“*”“*”或者空格表示。在网络搜或者空格表示。在网络搜索引擎中习惯用空格代替索引擎中习惯用空格代替“and”“and”。表示检出的
11、。表示检出的记录必须同时包含所有的检索词,可以缩小检索记录必须同时包含所有的检索词,可以缩小检索范围,减少命中文献量,提高查准率。范围,减少命中文献量,提高查准率。ABA and B例:检索例:检索“太阳能太阳能”文献文献太阳太阳能源能源【实例】检索【实例】检索“中国人民政府中国人民政府”这个网站,这个网站,可以输入可以输入“中国中国*政府政府”、“中国中国 and and 政府政府”、“中国中国 政府政府”等。等。【实例】检索课题【实例】检索课题“中国外汇储备规模的中国外汇储备规模的研究研究”不是一篇文章,需要检索有关的不是一篇文章,需要检索有关的期刊文章,其检索式宜表达为期刊文章,其检索式
12、宜表达为“中国中国 and and 外汇外汇 and and 储备储备 and and 规模规模”逻辑逻辑“或或”用用“or”“or”、“”或逗号表示。在网络搜索引擎或逗号表示。在网络搜索引擎中习惯用逗号代替中习惯用逗号代替“OR”“OR”。表示检出的记录中至少含。表示检出的记录中至少含有多个检索词中的任何一个,可以扩大检索范围,增有多个检索词中的任何一个,可以扩大检索范围,增加命中文献量,防止漏检。常用于连接同义词,相关加命中文献量,防止漏检。常用于连接同义词,相关词等。词等。ABA or B例:检索例:检索“光盘和磁盘光盘和磁盘”文献文献光盘光盘磁盘磁盘【实例】在搜索引擎中输入【实例】在搜
13、索引擎中输入“计算机计算机OROR多多媒体媒体OR Windows98”OR Windows98”则查询至少包含则查询至少包含“计算机计算机”、“多媒体多媒体”、“Windows“Windows 98”98”三者之一的信息。三者之一的信息。逻辑逻辑“非非”(NOT)”(NOT)表示检索结果中排除含有某些词的记录,可以缩小检索范围,减少文献输出量,但并不一定能提高查准率。ABA not B例:检索例:检索“除核能以外有关能源除核能以外有关能源”文献文献能源能源核能核能【实例】输入【实例】输入“automobile not car”“automobile not car”,就要求查询的结果中包含就
14、要求查询的结果中包含automobileautomobile(汽车),但同时不能包含(汽车),但同时不能包含carcar(小汽(小汽车)。车)。【实例】在搜索引擎中输入【实例】在搜索引擎中输入“电视台电视台-中中央电视台央电视台”,查询结果不包含,查询结果不包含“中央电中央电视台视台”。相同的检索词在不同的字段中检索到的结果不同。相同的检索词在不同的字段中检索到的结果不同。相同的检索词在不同的字段中检索到的结果不同。相同的检索词在不同的字段中检索到的结果不同。【实例】用中文科技期刊数据库检索机械产品采用计算机【实例】用中文科技期刊数据库检索机械产品采用计算机【实例】用中文科技期刊数据库检索机械
15、产品采用计算机【实例】用中文科技期刊数据库检索机械产品采用计算机辅助设计的论文。辅助设计的论文。辅助设计的论文。辅助设计的论文。用不同字段作为途径,如下所示:用不同字段作为途径,如下所示:用不同字段作为途径,如下所示:用不同字段作为途径,如下所示:选择选择选择选择”u=”u=”u=”u=任意字段任意字段任意字段任意字段”输入输入输入输入“计算机辅助计算机辅助计算机辅助计算机辅助*产品产品产品产品”,查出,查出,查出,查出2902290229022902篇;篇;篇;篇;选择选择选择选择”m=”m=”m=”m=题名或关键词题名或关键词题名或关键词题名或关键词”输入输入输入输入“计算机辅助计算机辅助
16、计算机辅助计算机辅助*产品产品产品产品”,查出,查出,查出,查出626626626626篇;篇;篇;篇;选择选择选择选择“t=“t=“t=“t=题名题名题名题名”输入输入输入输入“计算机辅助计算机辅助计算机辅助计算机辅助*产品产品产品产品”,查出,查出,查出,查出139139139139篇;篇;篇;篇;选择选择选择选择“k=“k=“k=“k=关键词关键词关键词关键词”输入输入输入输入“计算机辅助计算机辅助计算机辅助计算机辅助*产品产品产品产品”,查出,查出,查出,查出545545545545篇;篇;篇;篇;检索入口检索入口检索入口检索入口 选择选择选择选择“c=“c=“c=“c=分类号分类号分
17、类号分类号”输入输入输入输入“机械产品机械产品机械产品机械产品”的分类号的分类号的分类号的分类号“TH122”“TH122”“TH122”“TH122”年限设定,查到年限设定,查到年限设定,查到年限设定,查到11206112061120611206条。条。条。条。也叫也叫“邻接检索邻接检索”,表示两个或多个检索词之间的关表示两个或多个检索词之间的关系检索方式,常用的位置算符有系检索方式,常用的位置算符有:1.w(with)1.w(with)表示两个检索词前后次序固定,二者之间只能间隔连字表示两个检索词前后次序固定,二者之间只能间隔连字符、空格或者是逗号。符、空格或者是逗号。【实例】【实例】在在
18、OCLCOCLC中输入中输入communication w satellitecommunication w satellite;2 2.wN(with N)wN(with N)表示两个检索词前后次序固定,二者之间最多间隔表示两个检索词前后次序固定,二者之间最多间隔N N个个字符。字符。【实例】【实例】在在EBSCOEBSCO中输入中输入communication w3 satellitecommunication w3 satellite;3.3.2 3.3.2 位置检索算符位置检索算符 3.n(Near)3.n(Near)表示两个检索词可以互换顺,表示两个检索词可以互换顺,二者之间只能间隔
19、连字符、空格或者是逗二者之间只能间隔连字符、空格或者是逗号。号。【实例】【实例】在在OCLCOCLC中输入中输入communication n communication n satellitesatellite;4.nN(Near N)4.nN(Near N)表示两个检索词可以互换表示两个检索词可以互换顺,二者之间最多间隔顺,二者之间最多间隔N N个字符。个字符。【实例】【实例】在在EBSCOEBSCO中输入中输入communication n3 communication n3 satellite;satellite;比较:在比较:在EBSCOEBSCO中输入中输入source and l
20、awsource and law、source w2 lawsource w2 law3.3.3 3.3.3 截词检索算符截词检索算符n n检索检索colorcolorn n检索检索computercomputer、microcomputermicrocomputer、minicomputerminicomputer 截词符(通配符)截词符(通配符)提高查全率,防止漏提高查全率,防止漏检的有力手段,也可以简化输入,包括有限截词检的有力手段,也可以简化输入,包括有限截词和无限截词,常用的截词符有:和无限截词,常用的截词符有:*,?,#,!*,?,#,!,$有限截词有限截词有限截词有限截词一个符号
21、表示一个字符,一般使用一个符号表示一个字符,一般使用一个符号表示一个字符,一般使用一个符号表示一个字符,一般使用“?”(英文半角问号)代表(英文半角问号)代表(英文半角问号)代表(英文半角问号)代表0-10-10-10-1个字符。个字符。个字符。个字符。比如比如比如比如:chip?:chip?:chip?:chip?可检索出:可检索出:可检索出:可检索出:chipschipschipschips(右截断)(右截断)(右截断)(右截断)无限截词无限截词无限截词无限截词一个符号表示任意多个字符,标准符号是一个符号表示任意多个字符,标准符号是一个符号表示任意多个字符,标准符号是一个符号表示任意多个字
22、符,标准符号是“*”“*”“*”“*”,代表,代表,代表,代表0-n0-n0-n0-n个字符,也称为通配符。个字符,也称为通配符。个字符,也称为通配符。个字符,也称为通配符。比如比如比如比如:comput*:comput*:comput*:comput*可检出:可检出:可检出:可检出:compute,Computer,compute,Computer,compute,Computer,compute,Computer,computers,computing,Computerizecomputers,computing,Computerizecomputers,computing,Compute
23、rizecomputers,computing,Computerize等等等等.注:不同的数据库所用的截词符不一样,使用应先查一注:不同的数据库所用的截词符不一样,使用应先查一注:不同的数据库所用的截词符不一样,使用应先查一注:不同的数据库所用的截词符不一样,使用应先查一下各数据库的帮助加以确认下各数据库的帮助加以确认下各数据库的帮助加以确认下各数据库的帮助加以确认3.3.3 3.3.3 3.3.3 3.3.3 截词检索算符截词检索算符截词检索算符截词检索算符后截断无限截断无限截断如:physic?截词检索与截词检索算符PhysicphysicsphysicstphysicalismPhysi
24、cphysicsphysicst如:physic*有限截断有限截断中文数据库里面中文数据库里面中文数据库里面中文数据库里面习惯称为习惯称为习惯称为习惯称为“前方前方前方前方一致一致一致一致”中截断中截断前截断前截断如:如:如:如:m?nmanmen如:如:如:如:*computer*computer*computer*computerminicomputerminicomputercomputercomputermicrocomputermicrocomputer中文数据库里面中文数据库里面中文数据库里面中文数据库里面习惯称为习惯称为习惯称为习惯称为“后方后方后方后方一致一致一致一致”n nT
25、itle(ti):computern nPy=2008n nLa=englishn n限定网站:n n限定网页:inurl:midi 沧海一声笑n n限定文件类型:filetype:3.3.4 3.3.4 3.3.4 3.3.4 字段限制检索字段限制检索字段限制检索字段限制检索3.3.5 3.3.5 3.3.5 3.3.5 其它符号其它符号其它符号其它符号1 1 1 1括号括号括号括号 括在其中的操作符先起作用。括在其中的操作符先起作用。括在其中的操作符先起作用。括在其中的操作符先起作用。三聚氰胺三聚氰胺三聚氰胺三聚氰胺*(*(*(*(农产品农产品农产品农产品+鸡蛋鸡蛋鸡蛋鸡蛋+牛奶牛奶牛奶牛
26、奶+大米大米大米大米)2 2 2 2引号引号引号引号 引号内的检索项以整体形式出现。如:引号内的检索项以整体形式出现。如:引号内的检索项以整体形式出现。如:引号内的检索项以整体形式出现。如:information retrieval information retrieval information retrieval information retrieval 表示表示表示表示information AND retrieval information AND retrieval information AND retrieval information AND retrieval 而而而而
27、“information retrieval”“information retrieval”“information retrieval”“information retrieval”则表示一个词组则表示一个词组则表示一个词组则表示一个词组3 3 3 3个别数据库使用的特殊符号个别数据库使用的特殊符号个别数据库使用的特殊符号个别数据库使用的特殊符号 某些搜索引擎使用加号(某些搜索引擎使用加号(某些搜索引擎使用加号(某些搜索引擎使用加号(+)表示该单词必须出现。)表示该单词必须出现。)表示该单词必须出现。)表示该单词必须出现。在某些搜索引擎中输入在某些搜索引擎中输入在某些搜索引擎中输入在某些搜索
28、引擎中输入“+“+“+“+电脑电脑电脑电脑+电话电话电话电话+传真传真传真传真”就表示要查找的内容必就表示要查找的内容必就表示要查找的内容必就表示要查找的内容必须要同时包含须要同时包含须要同时包含须要同时包含“电脑、电话、传真电脑、电话、传真电脑、电话、传真电脑、电话、传真”这三个关键词。这三个关键词。这三个关键词。这三个关键词。个别数据库例如个别数据库例如个别数据库例如个别数据库例如“国研网国研网国研网国研网”、山东标准网使用、山东标准网使用、山东标准网使用、山东标准网使用“&”“&”“&”“&”代替代替代替代替“and”“and”“and”“and”;欧;欧;欧;欧洲专利局光盘数据库的洲专
29、利局光盘数据库的洲专利局光盘数据库的洲专利局光盘数据库的“without”“without”“without”“without”、美国专利商标局数据库的、美国专利商标局数据库的、美国专利商标局数据库的、美国专利商标局数据库的“andnot”“andnot”“andnot”“andnot”就是通用的就是通用的就是通用的就是通用的“not”“not”“not”“not”。4.4.英语或汉语中都有许多虚词,不能作为检索词。英语或汉语中都有许多虚词,不能作为检索词。如:汉语中如:汉语中“的、地、得、了的、地、得、了”等助词等助词;英语中的英语中的a about also and any as at b
30、e a about also and any as at be between by both for some so not this withbetween by both for some so not this with等等介词或冠词等介词或冠词等 检索策略是对检索的全面策划,在操作上检索策略是对检索的全面策划,在操作上主要指检索式的编制和数据库的选择。主要指检索式的编制和数据库的选择。检索策略在计算机检索中直接决定检索结果检索策略在计算机检索中直接决定检索结果的准与全。的准与全。检索策略检索策略1.1.1.1.确定检索词确定检索词切分:是对课题的语句以词为单位进行切切分:是对课题的语
31、句以词为单位进行切分,转换为检索的最小单元。分,转换为检索的最小单元。例:检索例:检索“吸烟与肺癌的关系研究吸烟与肺癌的关系研究”相关文献。相关文献。例:检索例:检索“肺气肿病人的血氧测定法肺气肿病人的血氧测定法”方面的方面的相关文献。相关文献。注意:应保持词意义的完整。注意:应保持词意义的完整。删除:对不具有检索意思的虚词或过分宽删除:对不具有检索意思的虚词或过分宽泛的限定词应予以删除。泛的限定词应予以删除。替换:是对表达不清晰或容易造成检索误替换:是对表达不清晰或容易造成检索误差的词用更明确、更具体的词予以替换。差的词用更明确、更具体的词予以替换。如公交如公交公共交通,绿色包装公共交通,绿
32、色包装-环保包装环保包装等等增加:针对一词多义或者在检索结果中有增加:针对一词多义或者在检索结果中有很多干扰信息时,可采用增加检索词达到很多干扰信息时,可采用增加检索词达到“限义限义”的手段。的手段。例:神经网络在旋转机械故障诊断中的应用研究例:神经网络在旋转机械故障诊断中的应用研究 1.1.本课题包含本课题包含“神经网络神经网络”“旋转机械旋转机械”“故障诊断故障诊断”三个概念三个概念,“,“应用应用”和和“研究研究”属于意义过于宽泛的词,不应属于意义过于宽泛的词,不应该作为检索词。该作为检索词。2.2.扩展扩展 神经网络:相关的上位词有人工智能神经网络:相关的上位词有人工智能旋转机械旋转机
33、械故障诊断:相关词有故障定位、故障检测,上位词有故障诊断:相关词有故障定位、故障检测,上位词有容错技术容错技术 3.3.检索式:检索式:(神经网络(神经网络 OR OR 人工智能)人工智能)ANDAND(旋转机械)(旋转机械)AND(AND(故障诊断故障诊断 OR OR 故障定位故障定位 OR OR 故障检测故障检测 OR OR 容错技术)容错技术)检索式示例检索式示例1.1.1.1.检索关于研究鲁迅的论文,应选择什么检索字段。检索关于研究鲁迅的论文,应选择什么检索字段。检索关于研究鲁迅的论文,应选择什么检索字段。检索关于研究鲁迅的论文,应选择什么检索字段。【题解】必须选择标题或者关键词,【题
34、解】必须选择标题或者关键词,【题解】必须选择标题或者关键词,【题解】必须选择标题或者关键词,不能选择为作者途径不能选择为作者途径不能选择为作者途径不能选择为作者途径。2.“2.“2.“2.“知识产权知识产权知识产权知识产权”一词还可析出哪些隐含概念。一词还可析出哪些隐含概念。一词还可析出哪些隐含概念。一词还可析出哪些隐含概念。【题解】【题解】【题解】【题解】“专利权专利权专利权专利权”、“版权版权版权版权”、“著作权著作权著作权著作权”等概念。等概念。等概念。等概念。3.3.3.3.用中文科技期刊数据库检索著名经济学家胡鞍钢在用中文科技期刊数据库检索著名经济学家胡鞍钢在用中文科技期刊数据库检索
35、著名经济学家胡鞍钢在用中文科技期刊数据库检索著名经济学家胡鞍钢在公共管理学报公共管理学报公共管理学报公共管理学报 上面发表的论文。上面发表的论文。上面发表的论文。上面发表的论文。【题解】【题解】【题解】【题解】“A=“A=“A=“A=胡鞍钢胡鞍钢胡鞍钢胡鞍钢*J=*J=*J=*J=公共管理学报公共管理学报公共管理学报公共管理学报”。4.4.4.4.写出写出写出写出“研究法律与经济和政治的关系研究法律与经济和政治的关系研究法律与经济和政治的关系研究法律与经济和政治的关系“的课题的检索式。的课题的检索式。的课题的检索式。的课题的检索式。【题解】【题解】【题解】【题解】“法律法律法律法律*(经济(经
36、济(经济(经济+政治)政治)政治)政治)”5.5.5.5.检索有关检索有关检索有关检索有关“中国国内商业银行的信贷管理或信贷风险的中国国内商业银行的信贷管理或信贷风险的中国国内商业银行的信贷管理或信贷风险的中国国内商业银行的信贷管理或信贷风险的研究研究研究研究”方面的相关文献。方面的相关文献。方面的相关文献。方面的相关文献。【题解】(商业银行【题解】(商业银行【题解】(商业银行【题解】(商业银行-外资银行)外资银行)外资银行)外资银行)*(信贷管理(信贷管理(信贷管理(信贷管理+信贷风险)信贷风险)信贷风险)信贷风险)检索步骤检索步骤1 1检索准备检索准备 2 2选择合适的检索工具选择合适的检
37、索工具3 3选择检索途径选择检索途径4 4拟订检索式拟订检索式5 5实施检索实施检索6 6筛选文献筛选文献7 7索取原文索取原文 1.1.弄清课题学科属性、专业范围及其弄清课题学科属性、专业范围及其相关内容相关内容 首先明白是单一学科还是涉及多首先明白是单一学科还是涉及多学科或跨学科。学科或跨学科。当课题涉及多学科时,以主要学当课题涉及多学科时,以主要学科为检索重点,次要学科为补充。科为检索重点,次要学科为补充。例:超声波技术在兽医上的应用。例:超声波技术在兽医上的应用。检索准备检索准备2.2.弄清检索课题的信息类型和时间要求弄清检索课题的信息类型和时间要求 时间要求上,研究层次低、学科发展快
38、的,则检索的时时间要求上,研究层次低、学科发展快的,则检索的时时间要求上,研究层次低、学科发展快的,则检索的时时间要求上,研究层次低、学科发展快的,则检索的时段可以适当缩短。段可以适当缩短。段可以适当缩短。段可以适当缩短。例如:查例如:查例如:查例如:查“超声波技术在医学上的应用超声波技术在医学上的应用超声波技术在医学上的应用超声波技术在医学上的应用”和查国内外研究社和查国内外研究社和查国内外研究社和查国内外研究社会保障制度的文章。会保障制度的文章。会保障制度的文章。会保障制度的文章。3.3.考虑课题的特殊要求考虑课题的特殊要求4.4.明确用户自身的信息需求明确用户自身的信息需求 .要从概念入
39、手,而不是从字面意思入手;要从概念入手,而不是从字面意思入手;.概念扩展时要考虑同义词、相关词、上位词概念扩展时要考虑同义词、相关词、上位词/下位词等下位词等(既词表中提到的用、代、分、属、参、族),还要注意中英文既词表中提到的用、代、分、属、参、族),还要注意中英文混用的现象混用的现象 ;3.3.当课题比较生疏时,应当首先利用百科全书、图书等弄清当课题比较生疏时,应当首先利用百科全书、图书等弄清楚概念,了解课题的有关专业知识,弄清楚课楚概念,了解课题的有关专业知识,弄清楚课题的内容和要解题的内容和要解决的问题以及解决该问题的初步设想等,进而确定检索的主题范决的问题以及解决该问题的初步设想等,
40、进而确定检索的主题范围。围。4.4.人文社会科学的检索,如果是回溯检索,应该熟悉不同年人文社会科学的检索,如果是回溯检索,应该熟悉不同年代所使用的概念和术语代所使用的概念和术语 5.5.忽略那些意义过于宽泛、通用的词,比如忽略那些意义过于宽泛、通用的词,比如:“:“研究研究”、“应用应用”“”“探讨探讨”等。等。分析课题时须注意的问题分析课题时须注意的问题 明确检索要求,选择数据库明确检索要求,选择数据库选择数据库要考虑以下因素:选择数据库要考虑以下因素:1.1.检索目的:检索的时间范围、文献类型、检索深度为检索目的:检索的时间范围、文献类型、检索深度为题录、文摘还是全文等等题录、文摘还是全文
41、等等2.2.检索结果:对于研究生做学位论文来说,做课题前应检索结果:对于研究生做学位论文来说,做课题前应充分了解一下本课题国内外的研究现状(即论文的综述充分了解一下本课题国内外的研究现状(即论文的综述部分),这时应对该课题进行较全面的检索,包括综述部分),这时应对该课题进行较全面的检索,包括综述性的文章,要求全面;对于该课题的核心部分,即该课性的文章,要求全面;对于该课题的核心部分,即该课题所要解决的具体问题,创新的地方,则需要准,技术题所要解决的具体问题,创新的地方,则需要准,技术细节越细越好。细节越细越好。3.3.检索内容所属学科检索内容所属学科,对与自己相关的数据库要有一个对与自己相关的
42、数据库要有一个全面的了解全面的了解.筛选文献筛选文献 应当根据课题的科学技术要点,将检索应当根据课题的科学技术要点,将检索结果分为密切相关文献和一般相关文献。对结果分为密切相关文献和一般相关文献。对相关文献情况及对相关文献的主要论点进行相关文献情况及对相关文献的主要论点进行对比分析。对比分析。1 1 1 1网上下载原文网上下载原文网上下载原文网上下载原文2 2 2 2就近借阅就近借阅就近借阅就近借阅3 3 3 3文献传递文献传递文献传递文献传递 获取原文获取原文【例题】华中科技大学学生已知一些理工科类大学学【例题】华中科技大学学生已知一些理工科类大学学【例题】华中科技大学学生已知一些理工科类大
43、学学【例题】华中科技大学学生已知一些理工科类大学学位论文题目,如何获得原文?位论文题目,如何获得原文?位论文题目,如何获得原文?位论文题目,如何获得原文?【题解】【题解】【题解】【题解】方法方法方法方法1:1:1:1:使用华中科技大学图书馆的馆藏目录查询到图书形式的使用华中科技大学图书馆的馆藏目录查询到图书形式的使用华中科技大学图书馆的馆藏目录查询到图书形式的使用华中科技大学图书馆的馆藏目录查询到图书形式的学位论文,直接借阅:学位论文,直接借阅:学位论文,直接借阅:学位论文,直接借阅:方法方法方法方法2 2 2 2:使用图书馆购买的学位论文数据库检索,可以直接查:使用图书馆购买的学位论文数据库
44、检索,可以直接查:使用图书馆购买的学位论文数据库检索,可以直接查:使用图书馆购买的学位论文数据库检索,可以直接查看近年来的原文。看近年来的原文。看近年来的原文。看近年来的原文。方法方法方法方法3 3 3 3:本地没有的则通过网上检索得到题目后,再从高校图:本地没有的则通过网上检索得到题目后,再从高校图:本地没有的则通过网上检索得到题目后,再从高校图:本地没有的则通过网上检索得到题目后,再从高校图书馆、国家科技图书文献中心(书馆、国家科技图书文献中心(书馆、国家科技图书文献中心(书馆、国家科技图书文献中心(NSTLNSTLNSTLNSTL)通过馆际互借寻找全)通过馆际互借寻找全)通过馆际互借寻找
45、全)通过馆际互借寻找全文,收费较低,时差也短。文,收费较低,时差也短。文,收费较低,时差也短。文,收费较低,时差也短。方法方法方法方法4 4 4 4:外文图书可以通过:外文图书可以通过:外文图书可以通过:外文图书可以通过OCLCOCLCOCLCOCLC获取。获取。获取。获取。检索效率检索效率 查全率和查准率是判定检索效果的主要指查全率和查准率是判定检索效果的主要指标。标。查全率查全率:(Recall RatioRecall Ratio)指系统在进行某一检索指系统在进行某一检索时,检索出的相关文献量与系统文献库中相关文时,检索出的相关文献量与系统文献库中相关文献总量的比率。用公式表示为:献总量的
46、比率。用公式表示为:检出的相关文献量检出的相关文献量 系统数据库中的相关文献总量系统数据库中的相关文献总量 R=X100%扩大检索范围扩大检索范围,提高查全率的方法提高查全率的方法1 1 1 1、跨库检索、跨库检索、跨库检索、跨库检索2 2 2 2、选择较大检索范围的字段如摘要、选择较大检索范围的字段如摘要、选择较大检索范围的字段如摘要、选择较大检索范围的字段如摘要3 3 3 3、外文单词使用截词符、外文单词使用截词符、外文单词使用截词符、外文单词使用截词符4 4 4 4、使用上位词(如飞行器、使用上位词(如飞行器、使用上位词(如飞行器、使用上位词(如飞行器 _ _ _ _航天飞机航天飞机航天
47、飞机航天飞机 _ _ _ _载人载人载人载人航天飞机)航天飞机)航天飞机)航天飞机)5 5 5 5、考虑同义词或近义词(使用布尔逻辑符、考虑同义词或近义词(使用布尔逻辑符、考虑同义词或近义词(使用布尔逻辑符、考虑同义词或近义词(使用布尔逻辑符orororor连接)连接)连接)连接)6 6 6 6、逐步扩大算符的检索范围,逐步提高查全率的算、逐步扩大算符的检索范围,逐步提高查全率的算、逐步扩大算符的检索范围,逐步提高查全率的算、逐步扩大算符的检索范围,逐步提高查全率的算符依次是:位置算符符依次是:位置算符符依次是:位置算符符依次是:位置算符w w w w wn wn wn wnnear near
48、 near near 逻辑算符逻辑算符逻辑算符逻辑算符and and and and or or or or 查准率查准率:(Precision RatioPrecision Ratio)指系统在进行某)指系统在进行某一检索时,检出的相关文献量与检出文献总一检索时,检出的相关文献量与检出文献总量的比率。用公式表示为:量的比率。用公式表示为:检出的相关文献量检出的相关文献量 检出的文献总量检出的文献总量 P=X100%缩小检索范围,提高查准率的方法缩小检索范围,提高查准率的方法1 1 1 1、选择专业性检索工具如使用产品数据库、特种搜、选择专业性检索工具如使用产品数据库、特种搜、选择专业性检索工
49、具如使用产品数据库、特种搜、选择专业性检索工具如使用产品数据库、特种搜索引擎。索引擎。索引擎。索引擎。2 2 2 2、选择检索范围较小的字段、选择检索范围较小的字段、选择检索范围较小的字段、选择检索范围较小的字段3 3 3 3、逐步缩小算符的检索范围,逐步提高查准率的算、逐步缩小算符的检索范围,逐步提高查准率的算、逐步缩小算符的检索范围,逐步提高查准率的算、逐步缩小算符的检索范围,逐步提高查准率的算符依次是:符依次是:符依次是:符依次是:逻辑算符逻辑算符逻辑算符逻辑算符or or or or and and and and 位置算符位置算符位置算符位置算符nearnearnearnear wn wn wn wn w w w w;使用算符;使用算符;使用算符;使用算符notnotnotnot排除干扰信息。排除干扰信息。排除干扰信息。排除干扰信息。4 4 4 4、使用二次检索、使用二次检索、使用二次检索、使用二次检索5 5 5 5、使用下位词、使用下位词、使用下位词、使用下位词OCLC检索结果EBSCO检索结果OCLC检索结果EBSCO检索结果EBSCO检索结果EBSCO检索结果