高频关键词可以反映研究的热门主题,关键词共现可以反映热门主题之间的关联,共现频率越高,相关的研究越丰富,笔者将上述检索到的文献关键词作为数据导入CiteSpace,展示了出现频率最高的前20个中英文关键词,结果如表1所示,首次出现年份反映这个热点最早提出的时间,中心度反映关键词在共现网络中的地位,中心度越接近1,说明该关键词在共现网络中处于中心位置。
中文关键词 | 频率 | 首次出现年份 | 中心度 | 英文关键词 | 频率 | 首次出现年份 | 中心度 |
引文分析 | 134 | 1982 | 0.5 | obsolescence | 68 | 1992 | 0.24 |
半衰期 | 77 | 1994 | 0.16 | half life | 21 | 1997 | 0.21 |
文献计量学 | 70 | 1990 | 0.09 | pharmacokinetics | 21 | 1997 | 0.16 |
被引半衰期 | 69 | 1995 | 0.27 | science | 20 | 1993 | 0.02 |
科技期刊 | 46 | 1990 | 0.27 | scientific literature | 20 | 1992 | 0.1 |
文献老化 | 32 | 1995 | 0.07 | age | 18 | 1993 | 0.13 |
老化速度 | 30 | 1991 | 0.05 | model | 15 | 1992 | 0.33 |
影响因子 | 30 | 2002 | 0.12 | planned obsolescence | 13 | 1997 | 0.01 |
期刊 | 27 | 1991 | 0.04 | citation | 13 | 1993 | 0.11 |
中国科技信息 | 26 | 1999 | 0.06 | performance | 13 | 2004 | 0.06 |
统计分析 | 26 | 1991 | 0.38 | growth | 13 | 1993 | 0.07 |
引文 | 23 | 1995 | 0.05 | children | 11 | 1997 | 0.16 |
核心期刊 | 21 | 1993 | 0.07 | management | 11 | 1994 | 0.13 |
普赖斯指数 | 21 | 2000 | 0.1 | innovation | 10 | 2004 | 0.04 |
引用半衰期 | 20 | 2012 | 0.08 | impact | 9 | 2003 | 0.01 |
统计数据 | 20 | 2000 | 0.01 | market | 9 | 2008 | 0.02 |
科技文献 | 16 | 1980 | 0.06 | citation analysis | 8 | 2008 | 0 |
总被引频次 | 12 | 2004 | 0.04 | durability | 8 | 2008 | 0.05 |
交通大学 | 12 | 1999 | 0.06 | metabolism | 8 | 1997 | 0.09 |
文献计量 | 12 | 1991 | 0.07 | productivity | 8 | 2003 | 0.09 |
从表1统计的CNKI和WOS高频关键词中可以看出,国内外研究主题既有相同之处又存在差异。首先,引文分析在中文研究统计结果中频率最高,其次还有文献计量学,在外文研究中citation analysis也在前20,可见引文分析/citation analysis和文献计量学是大家主要使用的研究方法;其次,关于半衰期,国内外主要研究对象包括科技文献/scientific literature和期刊/journal,主要研究内容包括文献老化的模型/model、老化指标影响因子/impact、被引次数/citation等,此外,半衰期指标和同样作为文献老化指标的普赖斯指数共现的次数也很高,相关研究主要讨论二者之间的关系或者直接将他们共同作为期刊老化的测度指标。而在外文文献中,半衰期研究热点更多还涉及到半衰期的实际应用,比如半衰期在图书馆的文献编辑,以及在市场/ market、管理/management等方面的应用。相比较而言,外文文献对于老化指标本身概念和计算等的研究较少。
本研究进一步通过高频关键词共现图谱,显示高频关键词之间的关系,以及利用CiteSpace聚类功能对高频关键词提取研究主题热点(相同颜色的关键词团是聚类产生的相关主题)。
从图2 CNKI收录文献关键词共现聚类图谱反映的结果来看,主要有4个主题:①以引文分析,统计分析为中心的期刊评价研究;②以文献剔除为中心的半衰期应用研究;③以影响因子为中心的期刊评价指标研究;④以期刊和文献为中心的文献老化研究。
从图3 WOS收录文献关键词共现聚类图谱来看,主要有4个主题:①以citation analysis/impact为中心的影响力评价研究;②以obsolescence/scientific literature为中心的科学文献老化研究;③以planned obsolescence/innovation为中心的文献老化实际应用研究;④以pharmacokinetics/children为中心的医学研究。
由上述聚类主题结果可以发现,在中外文文献中关于半衰期在引文分析和期刊评价方面的研究都占有重要位置,可以说半衰期指标是引文分析评价期刊常用指标之一。其次是半衰期指标的具体应用研究,主要是在图书馆中的应用和在医学领域中的应用。但是半衰期指标自提出以来,关于其意义和计算方法一直存在不少分歧
[21-22]。那么半衰期在期刊评价方面以及诸多实际应用领域方面的使用是否具有合理性?目前关于半衰期的使用情况的研究是否存在问题?为此,笔者结合检索到的755篇文献,总结了国内外关于半衰期指标的含义、计算方法以及期刊评价中半衰期指标的选择方面的研究内容。
(1)期刊评价中半衰期指标的选择。80%的研究在评价期刊时会选择基于共时方法计算被引半衰期和引用半衰期,而较少使用历时半衰期。主要有以下两个原因:①共时半衰期计算方便,各大数据库(如CNKI、JCR)都有根据收录情况计算的半衰期指标,并发布在年度报告里,方便研究者下载和检索。而历时半衰期从文献老化定义出发,需要在知道文献发表之后所有被引量的基础上进行计算,这显然具有很大难度,因此学者们通过预测模型来估计文献未来引用的情况,以此来计算历时半衰期,误差难以评价,合理性存在争议。②被引半衰期和引用半衰期表达的含义更加丰富,除了大体上可以反映期刊老化速度以外,被引半衰期还反映了期刊的办刊质量,引用半衰期还反映了期刊引用文献的时效性,对较新研究成果的关注程度。相比之下,历时半衰期主要表征期刊文献价值的衰减速度,表征含义较为单一。
(2)期刊评价中半衰期指标的计算方法。关于半衰期的计算,国内外学者多年来不断在创新,不断在验证
[18]。目前,被大家广为接受和使用的半衰期指标是基于共时角度计算的期刊被引半衰期和引用半衰期,以及基于历时角度计算的历时半衰期。首先,期刊被引半衰期和引用半衰期基于概念,可以使用作图法(根据引文累积量随着出版年份分布图找到引文累积量达到一半处所对应的统计年份)、插值法(根据统计的引用数据,找出引用累积百分比最接近50%的年份,计算距离统计当年的间隔时间)、公式法(基于文献老化的经典公式B-K方程或者莫蒂列夫修正式,除了经典公式,学者们根据实际数据推导设计出许多半衰期计算公式
[4],但是适用性或多或少存在争议)
[5]。关于历时半衰期的计算,根据概念目前主要有两种计算思想:①利用文献老化模型,通过公式计算半衰期,例如布鲁克斯累积指数模型
[6];②基于灰色一阶线性方程预测理论来预测文献指标的未来发展,以此来计算半衰期
[7]。两种方法都获得了一些认可。
(3)期刊评价中半衰期指标的含义。大量的研究通过文献计量和引文分析来比较半衰期指标的变化和差异,来评价和讨论学科或者期刊的生命周期、发展速度,以及学科利用文献的时效性和研究成果生命力。
综上所述,半衰期指标在期刊评价中扮演着重要的角色,但是半衰期指标的计算受多种因素影响,如期刊每年载文量的上下波动会影响期刊引用情况;学科的性质差异会导致期刊半衰期评价横向比较的不合理;学者们关注的研究重点与热点的变化会影响期刊引用情况
[10]。但是大部分研究在使用半衰期指标进行期刊评价时未考虑上述影响因素对评价结果的影响,对于半衰期指标的解读也存在不合理之处,将共时半衰期和历时半衰期的概念混淆。因此,本文基于实际统计数据,将半衰期指标与期刊影响力评价指标进行对比研究,并对半衰期指标的概念深入剖析,讨论半衰期指标在学术期刊评价中应用的合理性。