合理发挥引文索引在学术评价中的作用
沈固朝
如何正确看待引文索引用于学术评价,不少学者已经就这一问题发表过很有见地 的文章。但在探讨过程中依然存在着很多质疑和误解。
引文索引兼具和推荐功能
判断一项学术成果的价值,往往要看其能否得到他人不断地解读和引用,能否很方便地被人查询到并用于相关的研究中。能否在更大范围内得到学术同行的认可。要做到这一点,检索是必不可少的,是进行学术评价的重要保障。科学的发展在于继承和创新,通过检索作者不仅可以利用前人的劳动成果,提高研究效率,而且在原来的基础上可能有新的发现。引文索引不同于一般的索引,它立体地展现出文献之间的引证关系,显示了科研成果之间、刊载文献的期刊之间以及文献所属学科之间的内在联系,使许多论文有机联系起来,构成论文网、著者网,并在相关的学科领域形成文献网。
引文索引的特殊检索功能使它不可避免地兼具评价和推荐功能.这是其他检索工具难以做到的。引文索引要将最优秀的文章推荐给读者.收选最有影响力的高质量期刊就成为其最主要的工作。《科学引文索引)(SCI)和《社会科学引文索引)(SSCI)依照文献计量学原
理编制了《期刊引文报告》(JCR),对于每一份被收录期刊,JCR提供以下的统计数据:通过影响因子评价和比较一种期刊相对于同学科中其他期刊影的响力;通过即年指数比较同一年内期刊中的论文被引用的频率:通过被引半衰期反映被引用论文价值的持久性:通过引用期刊列表及被引期刊列表反映引用某特定期刊的频繁程度:通过总引用次数反映该刊在当年被其他期刊引用的情况等等。这些指标可为出版社调整编辑策略,为图书馆藏书建设提供选刊依
据, 为组成特定专业期刊网络提供数据支持。
文献计量学所总结出的引用规律并不是专门针对文科或理科的,文理科文献交流具有共同的规律。自然科学在世界上尚有一些公认的学术权威期刊,也许可以作为一种衡量研究成果的依据,但人文和社科类期刊因其意识形态的差异等原因,从来就没有确定过学术期刊的级别和是否核心。要说明的是,尽管自然科学与人文社会科学期刊存在差异,但依据文献计量学所总结出的引用规律并不是专门针对文科或理科的,而是在普遍总结各类学科文献交流规律的基础上得出的。换言之.任何一个学科的文献在其交流过程中部是遵循着一定规律的,如集中与分散规律、增长规律和老化规律等。
其中,集中规律是指某一学科的大部分较高质量的文献往往相对集中在少数期刊中,而其另一小部分文献则分布在大量相关期刊中。如果将这些期刊按其刊载某一个学科的论文数量,依次递减顺序排列起来。就可以从这些期刊按中区分载文量最高的“核心区”.这就是著名的布拉德福定律。用现在通俗的说法就是.经过筛选而确定的占总量20%的期刊上的论文可以满足高价值学术论文引用需求的80%。这一定律普遍适用于国内外各个学科。
引文计量法是同行评价的有力补充
引文索引不是单一的量化工具,而是定性与定量评价相结台的产物。定性评价是刊物编辑依据学术标准筛选出价值较高的论文.再经同行专家评审后入选。引文数据库在评选来源期刊时也要经专家或同行的审核或推荐,如CSSCI在创建初期先后两次聘请全国1000位各学科的教授和研究员对来源期刊的选择进行定性评价。在定量方面,被引数据是成千上万科研人员在学术研究中经过筛选、查询、参考和利用的结果。CSSCI辑录了23个学科的十几万篇论文,这样的数据量是抽样调查和同行评审都做不到的.少数失范行为很难扭曲它在总体上的公正性。
同时我们也应意识到,定量指标相对客观但是定最指标并不等同于客观评价。文献的相互引用是一种复杂的思维过程,作为其表现形式的引用文献,仅仅是表面的联系和测度.索引加工人员是难以深人考察引用行为间的内在联系的。可以这样认为,文献被引用,反映的是某种影响力,影响力虽与高质量有关,但不是一个概念。在一些案例中,被引用越多.也许越象征着一种否定的评价。不常被引用的文献亦不能认为不重要。要解释某一成果的学术影响力本身就是很复杂的,没有同行的介入,没有对内容的认真分析,是很难得出质的判断的。
在引文计量方法引入评价之前,同行评议是主要的方法。美国对同行评议进行的调查显示.同行评议在理论和实践中存在着许多社会问题。这些问题并没有影响同行评议作为一种主要的方法在评价中发挥重要作用,因为迄今为止还没有一套可行的方法来完全代替同行评议的作用。同样,引文计量法作为对同行评议的补充,在美国人文社会科学研究成果评价中得到广泛采用。因为实践证明,作为一种较为公正、合理的评价人文社会科学研究的方法,引文计量法本身是不受任何个人主观因素干扰的,美国同行并没有因其不足而排斥它。要对某一学术成果的价值作出判断是如此复杂,以至于往往要在数年之后,或者得到学术共同体普遍承认之后能看出来,但这种滞后性的评价在需要定时或即刻进行评价时是做不到的。
制定合理评价方法
所有的引文索引都不能百分之百地收录所有期刊上的所有高价值学术论文。索引编制者们所要做的是尽可能提高其覆盖率和代表性。不同的国家、不同的学科、不同的教育和科研管理制度,甚至不同的研究对象和研究方法,造成同为学术期刊但又有各自不同的特点,产生的期刊影响因子有重大差异,处理的要求和方法也因环境而,造成这些区别的受制因素并非都是索引编制者们能解决的。
因此,借鉴期刊质量来评判论文质量是一种“无奈的选择”。一把钥匙只能开一把锁,将引文工具当做一把万能钥匙来使用.不仅无助于克服其自身的缺陷,反而因社会上各种不良风气放大了它的不足之处。当然,引文工具在其应用于评价时本身也在不断改进。
文献计量学家们曾就文献计量工具用于评价问题指出,只有当人们对文献计量学指标的自身缺陷有了足够的认识时,也只有在这些指标与其他更多的定性评价信息相融合时,文献计量学指标才能成为科研缋效评价的有效工具。
我们提倡要全面地、正确地看待引文工具用于评价的问题。所谓“全面”就是要注意任何工具使用不当都会造成恶果。既要看到用于评价的引文工具的有利一面,也要看到不足的一面;在推行过程中要关注它的问题,要看到引用的不同动机及其复杂性所造成的“引文率”在定量评价中被放大了的缺陷。所谓“正确地看待”就是要客观地评价引文分析工具的作用,既不夸大,也不贬低。不要将SCI或SSCI论文与学术价值完全等同起来;不要将高水平期刊与高水平论文完全等同起来;不要将高引用与高水平等同起来;不要将影响力与创新力等同起来;不要将来源期刊收录标准与科研评价标准等同起来。评价导向不是让研究人员为发表文章而写文章.而是应该遵循科学研究的规律去制定科学合理的评价方法,切忌将定量评
价绝对化和简单化。