《引文分析法ppt课件.ppt》由会员分享,可在线阅读,更多相关《引文分析法ppt课件.ppt(66页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第十章 引文分析法 (Citation Analysis)济宁医学院信息工程学院 引文分析引文分析 (Citation Analysis) 别称:别称:引文分析法、引用文献分析法 依据:依据:文献间存在的相互引证的关系和特点 方法:方法:图论、模糊集合、数理统计等数学方法 比较、归纳、抽象、概括等逻辑方法 对象:对象:科学期刊、论文、著者等 结果:结果:通过对研究对象的引用或被引用情况进 行分析,揭示其数量特征和内在规律 要素:要素:正文和引文,即引用的文献和被引用的 文献第十章 引文分析法 引文分析的假设前提引文分析的假设前提假设前提假设前提: 文献的引用表示作者确实使用过该文献 文献的引用
2、是文献价值、重要性及影响力的指标 好的文献才会被引用 原始文献和引用文献之间必然有相关性 所有的引用都是同等重要 期刊引用报告收录的期刊能正确代表整个学科领域并支援其研究目标与目的 引用次数是评量引用文献是否有意义的有效指标 第十章 引文分析法 引文分析法的产生和发展引文分析法的产生和发展1873年,美国学者谢泼德(Shepard)创办谢泼德引文(Shepards Citation)世界上最早关注引文分析,建立引文类检索,为早期的引文分析做好了准备;1934年,英国文献计量学家布拉德福(S.C. Bradford)在工程(Engineering)杂志上发表了关于特定主题的情报源(Sources
3、 of Information Specific Subjects)一文,成为阐述文献离散规律的开山文献;1948年,布氏在其专著文献工作(Document)中提出可定量描述文献序性结构的经验定律,奠定了核心期刊与非核心期刊的思想,同时也对科学的文献分析提出了更高层次的要求;1955年美国著名情报学家尤金加非尔德博士(Eugene Garfield) 在Science杂志上发表了“Citation index for sciencenew dimension in documentation through associate of ideas”一文,提出利用引用文献追踪科学进展的概念,开启了
4、引文分析的大门,至此引文分析法正式产生;第十章 引文分析法1963年加非尔德博士在其领导的美国科学信息研究所(ISI)创办了科学引文索引(SCI, Science Citation Index),使引文分析进入了实用阶段;1973年、1978年加非尔德博士还分别创办了社会科学引文索引(SSCI, Social Science Citation Index)和艺术和人文学科引文索引(A&HCI, Art & Humanities Citation Index),主要用于探讨科学的结构、评价与选择情况,考察科学著作及科学家的社会影响等;1973年亨瑞斯贸 (Henry Small)发表了 “Co-
5、citation in the scien-tific literature: A new measure of the relationship between two documents”,首先提出了共引分析这一新型的引文分析方法。此方法是在原有引文分析方法的基础上,借助国际上新兴的科学知识图谱绘制方法(Mapping of Science)与信息可视化技术(Information Visualization), 绘制科学计量学期刊共引地图,实现了引证分析的可视化. 引文分析法的产生和发展引文分析法的产生和发展第十章 引文分析法信息计量学 第十章 引文分析法v第一节 引文分析的基本概念和方
6、法v第二节 引文分析的主要工具(自学)v第三节 引文分布规律及主要指标分析v第四节 科学期刊的引文分析v第五节 引文网络与聚类分析v第六节 引文分析法的应用信息计量学第十章 引文分析法一、引文分析的相关概念 被引证文献被引证文献(cited paper):是指论文后面列出的一条条“参考文献”。又叫被引文、被引文献、被引用文献、参考文献、受引文献。 引证文献引证文献(citing paper):是指引用了参考文献的那篇文献,也叫被引文献的源、引用文献、施引文献。 引证网络引证网络(citation network):是指文献群体及由其相互引用关系形成的这种结构,可以追溯科学发展的历史,评价科学发
7、展的规模和趋势。第一节第一节 引文分析的基本概念和方法引文分析的基本概念和方法一篇论文这篇论文的参考文献参考论文参考书参考专利引证关系示例引证关系示例 199219572004Related Records相关文献相关文献 该课题的起源、该课题的起源、 修正、变迁、发展修正、变迁、发展该课题的演变、该课题的演变、最新进展最新进展单一引文关系单一引文关系多引文关系多引文关系引文网络引文网络PresentFuturePastT i m eSubjectMaterial Sciences. Gene Engineering.Electronics.跨越学科、时间的界限,揭示知识的互动、生长过程跨越学
8、科、时间的界限,揭示知识的互动、生长过程信息计量学第一节第一节 引文分析的基本概念和方法引文分析的基本概念和方法第十章 引文分析法一、引文分析的相关概念引文分析引文分析就是利用各种数学及统计学的方法和比较、归纳、抽象、概括等逻辑方法,对期刊、论文、著者等各种分析对象的引证和被引证现象进行分析,以揭示其数量特征和内在规律的一种文献计量学分析方法。应用领域:应用领域:l确定和选择核心期刊l测定学科的影响及重要性l研究学科结构l研究学科情报源的分布l研究科学交流和情报传递规律l研究文献老化和情报利用规律l研究科学家之间的交流,从而对科学发展水平和人才进行评价引文动机(citation motivat
9、ion)-温斯托克(温斯托克(M.Weinstock) (1) Paying homage to pioneers.(2) Giving credit for related work (homage to peers).(3) Identifying methodology, equipment, etc.(4) Providing background reading.(5) Correcting ones own work.(6) Correcting the work of others.(7) Criticizing previous work.(8) Substantiating
10、claims.(9) Alerting researchers to forthcoming work.(10) Providing leads to poorly disseminated, poorly indexed, or uncited work.(11) Authenticating data and classes of fact - physical constants, etc.(12) Identifying original publications in which an idea or concept was discussed.(13) Identifying th
11、e original publication describing an eponymic concept or term as, e.g., Hodgkins disease, Paretos Law, Friedel-Crafts Reaction, etc.(14) Disclaiming work or ideas of others (negative claims).(15) Disputing priority claims of others (negative homage). Encyclopedia of Library and Information Science.
12、New York: Marecel Dekker, 1971, 5:16-40 第十章 引文分析法第一节第一节 引文分析的基本概念和方法引文分析的基本概念和方法二、引文行为与引证动机1 1)对开拓者表示尊重;)对开拓者表示尊重;2 2)对有关著作给予肯定;)对有关著作给予肯定;3 3)验证其所用的方法及仪器;)验证其所用的方法及仪器;4 4)提供背景性资料;)提供背景性资料;5 5)对自己的著作予以更正;)对自己的著作予以更正;6 6)对别人的著作予以更正;)对别人的著作予以更正;7 7)评价以前的著作;)评价以前的著作;8 8)为自己的论点寻求充分的论证;)为自己的论点寻求充分的论证;9 9
13、)提供研究者现有的著作;)提供研究者现有的著作;1010)对未被传播、很少被引或未被引证的文献提供向导;)对未被传播、很少被引或未被引证的文献提供向导;1111)验证数据及物理常数等;)验证数据及物理常数等;1212)核查原始资料中某个观点或概念是否被讨论过;)核查原始资料中某个观点或概念是否被讨论过;1313)核查原始资料或其他著作中的起因人物的某个概念或名词;)核查原始资料或其他著作中的起因人物的某个概念或名词;1414)否认他人的著作或观点;)否认他人的著作或观点;1515)对他人的优先权提出异议。)对他人的优先权提出异议。信息计量学第十章 引文分析法信息计量学第十章 引文分析法科学知识
14、具有明显的累积性和继承性;科学是一个统一的整体,学科之间是相互联系、交叉、渗透的。引用说明资料的出处,强调其可靠性;便于读者查考、核对;尊重他们的劳动成果。第一节第一节 引文分析的基本概念和方法引文分析的基本概念和方法二、引文行为与引证动机索恩(F.C.Thorne)为阿谀某人引用;以自诩为目的引用;为相互吹捧而带有偏见的引用;为支持某一观点牵强的引用;为维护某一学术研究派别利益的不正常引用;因迫于某种压力的引用。 Thorne F.C. The citation index: author case of spurious validityJ. Journal of Clinical Psy
15、chology,1977, (33):1157-1161 第十章 引文分析法第一节第一节 引文分析的基本概念和方法引文分析的基本概念和方法二、引文行为与引证动机信息计量学第十章 引文分析法三、引文分析的基本类型和步骤 引文数量分析:引文数量分析:主要用于评价期刊、论文或著者等,研究文献情报流的规律等; 引文网状分析:引文网状分析:主要用于揭示科学结构、学科相关程度,并展望学科的未来前景。 引文链状分析:引文链状分析:“引文链”,从引证文献和被引证文献反映出的主题相关性进行研究,揭示科学的结构和进行文献检索。 从被引证文献的语种、国别、年代、类型和著者语种、国别、年代、类型和著者等方面进行的引证
16、分析。第一节第一节 引文分析的基本概念和方法引文分析的基本概念和方法类型类型信息计量学第十章 引文分析法 选取统计对象:期刊、时间; 统计被引文数据:a、逐项统计文后的参考文献原始数据;b、利用引文工具,选取有关的被引文数据; 分析引文数据; 得出结论。第一节第一节 引文分析的基本概念和方法引文分析的基本概念和方法三、引文分析的基本类型和步骤步骤步骤信息计量学第三节第三节 引文分布规律及主要指标分析引文分布规律及主要指标分析第十章 引文分析法一、引文分布的类型 引文量按频次的分布 引文按年代分布 引文按学科或主题分布 引文按文献类型分布 引文按语种分布 引文按国别分布 引文按作者分布 引文按期
17、刊分布信息计量学第三节第三节 引文分布规律及主要指标分析引文分布规律及主要指标分析第十章 引文分析法二、引文量的分布规律引文量的理论分布引文量的理论分布 引文量是某一主体对象含有的参考文献数量。它是引文链的基本特征之一。通过引文数量的分析,不仅可以揭示文献引证与被引证双方的相互联系,而且还可以从定量的角度反映出主体之间的联系强度。如果两篇论文或两种期刊之间的引文数量大,就可以认为它们之间的引证强度大,说明其联系较紧密。 我们将一定量的论文的引文量数据进行分析比较,发现其变化规律表现为以平均数为中点,接近中点的频数最多,离平均数远的频数趋于减少,形成中间高两极低的正态理论分布。n 引文篇数分布引
18、文篇数分布 即每篇研究论文平均占有的引文篇数的分布。它不仅反映了论文作者引用文献的广度和深度,而且还能说明引文与被引文的学科内容之间的联系强度。 v学科性质学科性质v论文语种论文语种v人为因素人为因素信息计量学第十章 引文分析法第三节第三节 引文分布规律及主要指标分析引文分布规律及主要指标分析二、引文量的分布规律信息计量学第三节第三节 引文分布规律及主要指标分析引文分布规律及主要指标分析第十章 引文分析法三、加菲尔德引文集中定律 一个学科的非核心期刊在很大程度上是由其它学科一个学科的非核心期刊在很大程度上是由其它学科的核心期刊构成的。所有学科的核心期刊合在一起不会的核心期刊构成的。所有学科的核
19、心期刊合在一起不会超过超过10001000种,或许甚至少于种,或许甚至少于500500种。种。信息计量学第三节第三节 引文分布规律及主要指标分析引文分布规律及主要指标分析第十章 引文分析法四、引文测度的主要指标分析引文年代分析引文年代分析引文语种分析引文语种分析引文文献类型分析引文文献类型分析引文的国别分析引文的国别分析引文按作者的分析引文按作者的分析 1.1.引文年代分析引文年代分析 一般来说,随着年度的由远而近,引文量呈增长趋势,即时间愈近,被引用的文献愈多;文献被利用的峰值是该文章发生以后的第二年。 如果以引文年代为横轴,各年引文量为纵轴,在坐标图上描绘各年数据点,然后用一条线连接起来,
20、便可得到一条引文年代分布曲线。信息计量学第十章 引文分析法第三节第三节 引文分布规律及主要指标分析引文分布规律及主要指标分析四、引文测度的主要指标分析信息计量学第十章 引文分析法 2. 2. 引文语种分析引文语种分析 引用文献是由不同语种的文献构成的。某一语种的文献被引用量愈大,则说明该语种比较常用和重要。考察和分析引文语种的分布,对于人们有计划地引进外文文献、译文选题、外语教育等,颇有参考价值。第十章 引文分析法第三节第三节 引文分布规律及主要指标分析引文分布规律及主要指标分析四、引文测度的主要指标分析信息计量学 3. 3. 引文国别分析引文国别分析 对引文的国别分析,特别是各国文献互引情况
21、的统计分析,可以探明各国互引文献的状况,弄清国际文献交流的数量和流向。第十章 引文分析法第三节第三节 引文分布规律及主要指标分析引文分布规律及主要指标分析四、引文测度的主要指标分析信息计量学 4.4.引文类型分析引文类型分析 科学研究中引用的文献很广,有期刊论文、图书和特种文献。对被引文献的类型进行分析,将有利于确定文献情报搜集的重点。第十章 引文分析法第三节第三节 引文分布规律及主要指标分析引文分布规律及主要指标分析四、引文测度的主要指标分析信息计量学 5. 引文作者分析引文作者分析被引用的文献(参考文献) 别人所发表的 作者以前所发表的-自引机构、学科、语种、地区(国家)、时期自引第三节第
22、三节 引文分布规律及主要指标分析引文分布规律及主要指标分析第十章 引文分析法五、科学文献的自引分析信息计量学 作者自引 机构自引 期刊自引 学科自引 语种自引 地区(国家)自引 时期自引(当年指标)群体行为,基本上不受个体主观因素的影响(但受群体价值观的影响),相对充分的客观性。第三节第三节 引文分布规律及主要指标分析引文分布规律及主要指标分析第十章 引文分析法五、科学文献的自引分析信息计量学-个体行为,主观因素较多自引是指具有相对稳定性和文献生产连续性的科学主体,在其后期产出文献中引用自身前期产出文献的文献引用形式。作者自引能够发生,与作者作为“人”的特点是分不开的: 作者个体的相对稳定性;
23、 著作活动的连续性。期刊 名称和内容相对稳定; 出版连续。机构 人员组织和工作方向稳定; 研究、著述活动的连续性。第三节第三节 引文分布规律及主要指标分析引文分布规律及主要指标分析第十章 引文分析法五、科学文献的自引分析信息计量学自引量=某主体文献引用自身文献的次数被自引量=某主体文献被自身文献引用的次数自引量 = 被自引量自引率=%100该主体的文献引用总量某主体的文献自引量被自引率=%100量该主体的文献被引用总某主体的文献被自引量对自身的延续、依赖程度和对其它主体的开放程度。 反映出被引用中有多少是被自己引用的代表主体的文献自引绝对强度。第三节第三节 引文分布规律及主要指标分析引文分布规
24、律及主要指标分析第十章 引文分析法五、科学文献的自引分析信息计量学一、加菲尔德引文集中定律152种期刊 50%2000种期刊 84%第十章 引文分析法第四节第四节 科学期刊的引文分析科学期刊的引文分析信息计量学一、加菲尔德引文集中定律第十章 引文分析法第四节第四节 科学期刊的引文分析科学期刊的引文分析 1.对于整个自然科学,各学科的核心期刊总和不会超过1000种,甚至可能只有500种。对于单一学科,则集中的程度因学科、专业而异。 2.任何一个学科的非核心期刊(“尾部期刊”)在很大程度上是由其他学科的核心期刊构成的。信息计量学BradfordGrafield相同点:相同点:揭示了科学文献的集中与
25、分散现象和规律,揭示了科学文献的集中与分散现象和规律,可用于选择核心期刊可用于选择核心期刊差异:差异:发表论文按期刊的发表论文按期刊的分布(输出信息)分布(输出信息)被引论文按期刊的被引论文按期刊的分布(输入信息)分布(输入信息)描述单一学科(专描述单一学科(专业、主题)论文分业、主题)论文分布规律布规律揭示自然科学领域揭示自然科学领域多学科论文分布规多学科论文分布规律律布/加定律的联系与区别信息计量学一级指标一级指标得分得分二级指标二级指标得分得分政治标准政治标准是否有重大政治、科学、技术错误;严重失密;违反办刊宗旨,超越报道范围;严重违反科技期刊是否有重大政治、科学、技术错误;严重失密;违
26、反办刊宗旨,超越报道范围;严重违反科技期刊管理规定。管理规定。学术质量学术质量70总被引频次总被引频次10影响因子影响因子10他引率他引率7基金论文比基金论文比10获奖论文数获奖论文数10数据库、文摘刊物摘储数数据库、文摘刊物摘储数8报道时差报道时差5发行量发行量4社会效益与经济效益社会效益与经济效益5刊物上网情况刊物上网情况1编辑质量编辑质量26量和单位量和单位5插图和表格插图和表格4语言文字及校对语言文字及校对6其他项目其他项目9印刷出版质量印刷出版质量4封面、版式、印刷、装订封面、版式、印刷、装订3缴送样刊缴送样刊1第三届国家期刊奖科技期刊(学术类)评分标准第三届国家期刊奖科技期刊(学术
27、类)评分标准资料来源:评价与管理2006,4(2):78-79第十章 引文分析法第四节第四节 科学期刊的引文分析科学期刊的引文分析 如何评价一种科学期刊 ? ?信息计量学第四节第四节 科学期刊的引文分析科学期刊的引文分析第十章 引文分析法二、评价期刊的主要测度指标1. 期刊载文量期刊载文量 在给定时间内,期刊刊载的全部论文数量。描述的是期刊生产论文的能力,是一个与时间的长短和期刊的种类有关的量。 某种期刊(如图书馆工作研究)在某段时间内的载文量; 某类期刊(如情报学类)在某段时间内的载文量; 经常统计刊载“基金论文量”。信息计量学二、评价期刊的主要测度指标2. 期刊引证率期刊引证率在给定时间内
28、,期刊引证的全部参考文献数量。如:某篇论文(或某书、某刊)的被引文量,指该论文(或书、刊)中含参考文献的数量。描述期刊吸收外部文献的能力。3. 期刊被引率(学术影响力)期刊被引率(学术影响力)在给定时间内,期刊被引次数指被引证的全部次数。该指标反映了期刊在科学发展和文献交流中所起的作用,即影响力。第四节第四节 科学期刊的引文分析科学期刊的引文分析第十章 引文分析法信息计量学 平均引证率:平均引证率: 在给定时间内,该刊中参考文献总数除以载文量,即每篇论文平均占有的参考文献数。平均引证率是用来衡量研究对象吸收情报能力以及科学交流程度的高低的一个指标。 平均被引率:平均被引率: 在给定时间内,期刊
29、所载文献被引的次数除以该刊的全部载文量。平均被引率表示该刊的学术水平高低。二、评价期刊的主要测度指标第四节第四节 科学期刊的引文分析科学期刊的引文分析第十章 引文分析法4. 平均引文率平均引文率信息计量学5. 影响因子影响因子(Impact Factor,简称,简称IF) 影响因子主要用以调整和修正大刊、老刊凭借发表论文绝对数量而在期刊被引上所占的优势,是衡量期刊重要性,选择核心期刊时使用的一个重要指标。某刊影响因子的值越大,说明它的被引用率越高,质量也就越高。 某年度某刊的影响因子=总数前两年该刊所发表论文文的总次数该年引用该刊前两年论第四节第四节 科学期刊的引文分析科学期刊的引文分析第十章
30、 引文分析法二、评价期刊的主要测度指标影响因子的计算影响因子的计算例例: :计算计算科学通报科学通报的影响因子,已知:的影响因子,已知: 19991999年和年和19981998年所发表的论文总数为年所发表的论文总数为10001000篇(篇(N N19981998+ +N N19991999) ); 20002000年上述年上述10001000篇论文被引总次数为篇论文被引总次数为900900次(次( n n19981998+ +n n19991999 ););则则 20002000年年科学通报科学通报的影响因子为:的影响因子为:IPFIPF(2000) (2000) = 900/1000 =
31、0.90= 900/1000 = 0.90信息计量学信息计量学6. 即年指标即年指标(即时指标即时指标)即年指标=当年该刊发表文献总数文献的引用次数该年度对该刊当年发表 它是用来测度期刊被利用速度的指标,也是判断期刊重要性的一个依据,它是期刊质量中及时性和有用性相结合的客观评价指标。第四节第四节 科学期刊的引文分析科学期刊的引文分析第十章 引文分析法二、评价期刊的主要测度指标例例 如:如:1998年年低温工程低温工程杂志在当年发表的杂志在当年发表的67篇论文中,被当篇论文中,被当年年1286种统计源刊共引用了种统计源刊共引用了7次。次。 其即年指标为 0.104(=7/67)在1998年中国科
32、技论文统计源 1286种期刊中列第76位。信息计量学7. 期刊自引率期刊自引率 (self-citing rate) 是指某期刊全部参考文献中,引证该刊自己发表的论文所占的比例。 8. 期刊自被引率期刊自被引率(self-cited rate) 是指某期刊全部被引次数中,被期刊本身引证次数所占的比例。第四节第四节 科学期刊的引文分析科学期刊的引文分析第十章 引文分析法二、评价期刊的主要测度指标 这两个指标从不同角度描述了期刊的自引状况,本刊自己的引这两个指标从不同角度描述了期刊的自引状况,本刊自己的引证情况和被其他刊物使用情况。证情况和被其他刊物使用情况。信息计量学9. 被引半衰期被引半衰期(
33、cited half-life) -P393 从当前年份开始往前,该期刊被引用的总次数中,较新的一半是距离现在多长一段时间内发表的。可反映该期刊知识的老化快慢。引用累积曲线:论文的被引用峰值在其发表后的2-6年 10. 引证半衰期引证半衰期(citing half-life) -P393 从当前年份开始往前,引文数目达到截至当年引证期刊提供的总引证数50%的年份数。可反映期刊吸收资源的新旧情况。第四节第四节 科学期刊的引文分析科学期刊的引文分析第十章 引文分析法二、评价期刊的主要测度指标11. 核心引用期刊(核心引用期刊(高频被引证期刊高频被引证期刊) 按引文数量/引用次数排列。信息计量学一、
34、引文耦合与同被引的概念第五节第五节 引文网络与聚类分析引文网络与聚类分析第十章 引文分析法u1961年,美国人Kessler开始科技文献之间的文献配合研究。u定义:如果两篇(或多篇)论文同时具有同样的一篇或几篇参考文献,或者说它们共同引用了一篇或多篇论文,则这两篇论文之间的关系,称“文献耦合” (bibliographic Coupling),这两篇或多篇论文成为耦合论文(Coupled papers)。u耦合强度:共引参考文献的数量,若共引一篇参考文献,则这两篇论文就有一个引文耦(耦合单位,Coupling Unit)。引文耦合信息计量学一、引文耦合与同被引的概念第五节第五节 引文网络与聚类
35、分析引文网络与聚类分析第十章 引文分析法同被引u1973年,美国Henry Small和苏联Marshakova同时提出。u定义:是指两篇(或多篇)论文同时被后来的一篇或多篇论文所引证,则称这两篇(或多篇)被引证论文具有“同被引”(Co-citation)关系。u同被引强度(同被引频率):引用它们的文献数量。例如,如果两篇文献被n篇文献同时引用,则称这两篇文献具有同被引关系,其同引强度为n。信息计量学一、引文耦合与同被引的概念第五节第五节 引文网络与聚类分析引文网络与聚类分析第十章 引文分析法引文耦合与同被引的相同点u都是指两篇论文通过另外一篇或多篇论文建立起来的关系,都可以反映出文献之间的联
36、系程度和结果关系;u都可用于研究文献关系,进行文献检索和揭示科学结构等。引文耦合与同被引的不同点 见 P403信息计量学二、耦合分析第五节第五节 引文网络与聚类分析引文网络与聚类分析第十章 引文分析法u文献耦合u期刊耦合u著者耦合u学科耦合二、耦合分析1.文献耦合应用:应用:通过引文相关群分析学科之间的联系通过引文网络分析文献体系结构和学科结构为文献检索提供新的途径有耦合关系的一组论文必然具有某些共同属性:有耦合关系的一组论文必然具有某些共同属性:共同引证和追溯某一历史背景共同继承某些科学论断和经典著作共同商榷和研究某一值得争论的问题共同引证某些实验数据和统计资料同属一学科或专业属交叉学科或边
37、缘学科第五节第五节 引文网络与聚类分析引文网络与聚类分析第十章 引文分析法信息计量学二、耦合分析2.期刊耦合定义:两种科技期刊引证了同样一种或几种科技期刊,则这两种科技期刊之间的关系称为科技期刊耦合。期刊耦合强度(频率):同时被引证的科技期刊的总数。应用:应用:u判断科技期刊之间的关系u判断学科期刊的专业性质第五节第五节 引文网络与聚类分析引文网络与聚类分析第十章 引文分析法信息计量学二、耦合分析3.著者耦合由于论文的合著现象,著者耦合与论文耦合不是一回事,论文耦合群中论数小于或等于相对应的著者耦合群中的著者数。定义:分别由n 位著者完成的t篇论文同时引证了分别由m位著者完成的s篇论文,则称这
38、n位著者有耦合关系,即著者耦合。著者耦合强度(频率):被引证的著者数m为测度。应用:u展望学科的发展趋势u组成相关著者群,建立科研人才通讯网u在文献检索中的应用,从而提高查全率,查准率。第五节第五节 引文网络与聚类分析引文网络与聚类分析第十章 引文分析法信息计量学二、耦合分析4.学科(专业)耦合u不是以论文而是以学科为基本单位进行耦合u学科耦合现象所形成的是有关学科的相关群u定义:凡是属于某两个学科的文献共同引证了另一个学科文献,则称这两个学科有耦合关系,简称学科耦合。u耦合强度:被引证的学科的数量注意:注意: 不论文献的数量多少,只要都属于一个学科,则都按一个学科单位来计算; 学科耦合不是回
39、溯性的,耦合强度不是固定不变的;论文耦合是回溯性的,耦合强度是固定不变的。第五节第五节 引文网络与聚类分析引文网络与聚类分析第十章 引文分析法信息计量学二、耦合分析4.学科(专业)耦合应用:应用:u回顾学科发展的历史背景和沿革u跟踪并比较分析学科(或专业)耦合结构的变迁,能了解学科(或专业)发展或变迁的来龙去脉及其错综复杂的变化关系u为研究学科(或专业)交叉趋势提供分析的依据和素材u为某学科或专业图书馆选择资料提供依据第五节第五节 引文网络与聚类分析引文网络与聚类分析第十章 引文分析法信息计量学信息计量学三、同被引分析第五节第五节 引文网络与聚类分析引文网络与聚类分析第十章 引文分析法 文献同
40、被引 期刊同被引 著者同被引 学科同被引信息计量学四、引文的聚类分析第五节第五节 引文网络与聚类分析引文网络与聚类分析第十章 引文分析法原理:原理:指以耦合强度或共引强度等作为基本计量单位,对给定的引证文献集合或被引文献集合、学科或专业内容联系比较紧密的文献进行聚合的定量处理技术。 文献聚类分析可以利用SAS、SPSS等统计分析软件实现。 聚类分析的结果可以通过聚类图形进行可视化表达。信息计量学四、引文的聚类分析第五节第五节 引文网络与聚类分析引文网络与聚类分析第十章 引文分析法 步步 骤:骤: 寻找双引论文对、编制双引总目录 进行专业聚类(确定双引强度的阈值) 进行各种专项性研究和分析信息计
41、量学四、引文的聚类分析第五节第五节 引文网络与聚类分析引文网络与聚类分析第十章 引文分析法 簇(簇(cluster):一个数据对象的集合。一个数据对象的集合。在同一个类中,对象之间具有相似性;不同类的对象之间是相异的。簇要具备以下两个特点:高的簇内相似性;低的簇间相似性。 聚类分析聚类分析把一个给定的数据对象集合分成不同的簇。把一个给定的数据对象集合分成不同的簇。 聚类是一种无监督分类法聚类是一种无监督分类法: 没有预先指定的类别。没有预先指定的类别。部分聚类分析研究论文专题文献高被引论文的时间分布与同被引聚类分析 情报学报 1995年01期当年高被引论文的主题词链聚类分析及其在情报预测中的应
42、用 情报学报 1995年05期专题文献高被引论文的连续同被引聚类分析 情报理论与实践 1996年01期 专题文献高频主题词的共词聚类分析 情报理论与实践 1996年04期文献计量学共引分析系统设计与开发 情报学报 2000年04期国家国际科技合作文献计量学分析 情报学报 2000年06期利用引文时序和同被引聚类分析探索抗原CD44研究历史及现状 医学情报工作 2002年04期利用共词聚类分析探讨胃癌前病变研究现状 医学情报工作 2002年05期专题文献的同被引聚类分析在表现学科专业发展历史的可靠性评价 情报学报 2005年04期胃癌前病变低频被引论文的共词和共篇聚类分析 中华医学图书情报杂志
43、2002年03期生物信息学的共词分析研究情报学报 2003年05期运用共词聚类分析法研究生物信息学的学科热点医学情报工作 2004年05期 内容词-共引聚类分析及其在科学结构研究中的应用情报学报 1997年01期基于可视化的作者同被引技术的发展 情报学报 2005年02期基于CSSCI的论文同被引实证计量研究 图书情报知识 2005年05期基于基于Web of ScienceWeb of Science数据的图书情报学研究聚类分析数据的图书情报学研究聚类分析 情报杂志情报杂志 20072007年年2 2期期共词分析法研究共词分析法研究( (三三) )共词聚类分析法的原理与特点共词聚类分析法的原
44、理与特点 情报杂志情报杂志 20082008年年7 7期期 20062006年知识管理领域关键词共现强度的聚类分析年知识管理领域关键词共现强度的聚类分析 现代情报现代情报 20082008年年5 5期期 我国情报学硕士学位论文的共词聚类分析我国情报学硕士学位论文的共词聚类分析 情报科学情报科学 20082008年年0101期期国际科学学主题共词网络的可视化研究国际科学学主题共词网络的可视化研究1.科学4.知识6.绩效7.信息11.系统科学学的本质是研究科学的学科图1. K=12的关键词共词网络8.模型23.通信信息计量学一、引文分析法的应用领域第六节第六节 引文分析法的应用引文分析法的应用第十
45、章 引文分析法 测定学科的影响和重要性 研究学科情报源分布 确定核心期刊 研究科学交流和情报传递规律 研究文献老化和情报利用规律 研究情报用户的需求特点 科学水平和人才的评价信息计量学 h 指数(指数(h-index)加州大学圣地亚哥分校物理学家乔治赫希(Jorge E.Hirsch)提出。论文于2005年8月先在网上公布,引起了广泛的注意,英国自然、美国科学都立即做了报道。2005年11月正式发表在美国科学院院刊上。J. E. Hirsch. An index to quantify an individuals scientific research outputJ. PNAS,2005,
46、102(46):16569-16572第四节第四节 科学期刊的引文分析科学期刊的引文分析第十章 引文分析法 科学水平和人才评价科学水平和人才评价I propose the index h, defined as the number of papers with citation number h, as a useful index to characterize the scientific output of a researcher. 信息计量学信息计量学 h代表代表“高引用次数高引用次数”(highcitations) 一个人的一个人的h指数:是指他至多有指数:是指他至多有h篇论文分
47、别被引用了至少篇论文分别被引用了至少h次。次。例如,赫希本人的h指数是49,这表示他已发表的论文中,每篇被引用了至少49次的论文总共有49篇。 赫希认为h指数能够比较准确地反映一个人的学术成就。一个人的h指数越高,则表明他的论文影响力越大。第四节第四节 科学期刊的引文分析科学期刊的引文分析第十章 引文分析法科学水平和人才评价科学水平和人才评价序号序号被引文献题名被引文献题名被引频次被引频次1 1文献计量学文献计量学2032033 3论知识管理与知识创新论知识管理与知识创新46464 4论知识管理与信息管理论知识管理与信息管理45455 5论知识管理与竞争情报论知识管理与竞争情报34346 6论
48、数字图书馆的知识管理论数字图书馆的知识管理31317 7网络信息计量学及其应用研究网络信息计量学及其应用研究29298 8论知识管理与图书情报学的变革论知识管理与图书情报学的变革27279 9再论知识管理与信息管理再论知识管理与信息管理22221010论数字图书馆的知识产权保护论数字图书馆的知识产权保护21211111市场经济信息学市场经济信息学17171212知识管理与图书情报学的创新知识管理与图书情报学的创新16161313论信息资源和社会发展的关系论信息资源和社会发展的关系16161414关于信息管理几个问题的探讨关于信息管理几个问题的探讨16161515论知识经济中的知识管理及其实施论
49、知识经济中的知识管理及其实施16161616信息资源对社会发展的影响和作用信息资源对社会发展的影响和作用16161717151518-19141420121221-2311112424101025-2625-268 827-2927-297 730-3430-346 635-3835-385 539-4839-484 449-5849-583 359-7359-732 274-11174-1111 1CSSCI邱均平论著被引统计(邱均平论著被引统计(1998-2005)信息计量学赫希认为:如果一个人在从事科研20年后(从发表第一篇论文算起),h指数能达到20,就算是一名成功的科学家;能达到40
50、,则是一名杰出的科学家,很可能只能在名牌大学或研究所才能见到;能达到60(或30年后达到90),则是首屈一指的大科学家了。赫希同时提出,美国研究型大学的物理学家要获得永久教职(副教授),h指数一般为10到12,晋升为正教授则大约为18。成为美国物理学会会士的h指数一般在15到20,而成为美国科学院院士则一般在45或更高。第四节第四节 科学期刊的引文分析科学期刊的引文分析第十章 引文分析法科学水平和人才评价科学水平和人才评价信息计量学10.6.3 引文分析法的局限性第六节第六节 引文分析法的应用引文分析法的应用第十章 引文分析法1. 文献被引用并不完全等于重要。2. 著者选用引文受到可获得性的影