【邸乘光】科学的评价体系体现质与量的结合-哲学中国网

学术批评

【邸乘光】科学的评价体系体现质与量的结合

　　　　构建中国特色哲学社会科学评价体系，对进一步繁荣发展中国特色哲学社会科学，具有重要引导作用。近年来，哲学社会科学评价是学界普遍关注的问题。围绕构建中国特色社会科学评价体系，学界进行了多方面探讨，提出了很多意见和建议。尽管见仁见智，但对构建中国特色哲学社会科学评价体系还是具有一定意义的。这里，笔者也想就有关的几个问题略陈管见。

　　　　归根结蒂是对研究成果的评价

　　　　哲学社会科学评价涉及评价主体、评价客体、评价目的、评价标准、评价方法和评价制度等诸多方面，而且每一个方面又都是一个包含多层次、多方面内容的体系，这就决定了构建中国特色哲学社会科学评价体系是一项非常复杂的系统工程。实施这一系统工程，首先应在评价客体上达成共识，搞清楚哲学社会科学评价所要评的对象究竟是什么。

　　　　哲学社会科学评价客体是复杂多样的，基本的应包括哲学社会科学研究人员、研究项目、研究成果、研究机构、相关媒体等。对各类客体的评价，其具体内容又会有所不同。具体地说，以研究人员为客体的评价，主要是对研究能力、学术水平和研究绩效而言；以研究项目为客体的评价，主要是对项目设计（论证）的（立项）评价和对项目成果的（鉴定和结项）评价；以研究成果为客体的评价，主要是对其科学性、价值性、创新性、规范性的评价；以研究机构为客体的评价，主要是对其研究队伍、研究能力、学术水平、研究绩效和综合实力进行评价；以媒体（包括出版社、社科期刊、报纸学术理论版、广播电视社科理论频道和网络学术理论频道等）为客体的评价，主要是对（出版、发表和传播）内容质量（价值和水平）、载体形式和以社会效益为主的综合效益的评价。

　　　　综观以上评价客体，我们不难发现，其中最根本、最核心、最重要的就是对研究成果的评价。在对研究人员的评价中，不论是对研究能力、学术水平的评价，还是对研究绩效的评价，都要依据对其研究成果的评价来作出；在对研究项目的评价中，不论立项评价，还是鉴定和结项评价，本身都是对研究成果的评价（作为立项评价客体的项目设计论证实际上也是研究成果的一种特殊形式）；在对研究机构的评价中，不论是对其研究队伍、研究能力、学术水平的评价，还是对其研究绩效和综合实力的评价，也都是建立在对其科研成果评价的基础之上的；在对媒体的评价中，不论是对出版社、期刊和报纸的评价，还是对广播电视和网络的评价，同样也都是以其传播内容（不同形式的研究成果）的评价为核心的。

　　　　由此可以得出结论：从一定意义上说，哲学社会科学评价归根结蒂是对哲学社会科学研究成果的评价。明确这一点，对构建中国特色哲学社会科学评价体系，至关重要。

　　　　评价目的多样性决定其他评价要素的多元化

　　　　哲学社会科学评价是一种有明确目的的评价。评价目的可以说是哲学社会科学评价的“纲”。所谓哲学社会科学评价的目的，实际上就是哲学社会科学评价主体（这里主要指哲学社会科学评价的组织者）根据需要预先设定的评价目标，也就是为什么要进行评价。

　　　　哲学社会科学评价目的是多元的，可以有多种分类方法。比如，可以根据评价效力的长短分为长远的、中期的、近期（短期）的和即时的；可以根据评价主体（这里也是指评价的组织者）的性质和层级分为政府性的、系统性的、团体性的和国家的、地方的、部门（单位）的；可以根据评价内容的属性分为选拔性的、评级性的、评奖性的、立项性的、鉴定性的、考核性的，等等。

　　　　哲学社会科学评价目的的多样性决定了其他评价要素的多元化。笔者赞同叶继元教授的观点：“不同的评价目的决定着不同的评价标准和指标、不同的评价方法和评价专家的选择以及评价程序的确定，它是评价的龙头，分类评价的动因，规定、制约和导引着整个评价的方向和具体做法。”目前许多哲学社会科学评价之所以出现问题，主要是因为评价目的不明确或没有根据评价目的确定不同的评价标准、选择不同的评价专家、采用不同的评价方法所造成的。

　　　　哲学社会科学评价目的的多样性决定了评价客体的多元化。虽然说哲学社会科学评价归根结底是对研究成果的评价，但进行不同目的的评价，所需要评价的研究成果也还是有所区别的。比如，以选拔为目的评价，本身就有选人、选成果、选机构、选媒体等区别，所需要评价的研究成果自然也会有所不同，有的可能是规定时间段的“代表作”，有的则可能是全部时间的“代表作”，有的可能既包括“代表作”，又包括其他成果等；以评级为目的评价，也有个人与集体（团队或机构）之分，就个人而言，一般需要评价的是规定时间段的“代表作”，同时也可能参考规定时间段的其他成果；以评奖为目的评价，又有个人与机构之别，就个人而言，一般只需要规定时间段内自认为最能代表本人学术水平的某一项成果，就机构而言，一般则需要从规定时间段内筛选出来的规定项数的成果；以出版和发表为目的的评价，需要评价的是全部来稿（包括约稿和自由投稿）；以考核为目的的评价，则需要根据考核目标的规定考核有关成果或全部成果。

　　　　哲学社会科学评价目的的多样性不仅决定了评价客体的多元化，同时也决定了评价标准和指标、评价专家、评价方法和程序的多元化。因此，我们既要注意防止用同一套评价标准和指标、同一类评价专家、同一种评价方法和程序去评价所有的评价客体，也要注意不能因为在某个方面的评价中由于简单套用有关评价标准和指标、评价方法等而出现了一些问题，就全盘否定整个哲学社会科学领域的评价体系和评价活动。

　　　　不能无视量化标准中内含的质量标准

　　　　定量评价与定性评价是哲学社会科学评价的两种基本方法。定性评价一般是通过同行评议来实现。同行评议是一种被国内外广泛运用的学术评价方法。同行评议的优点在于定性，能够充分发挥同行专家的智慧和经验，减少因信息数据不全或不精确而产生的片面性和局限性，适用于某些因素难以量化的情况。但评议专家专业上的过度专一以及由此产生的与被评议内容上的专业差异也将影响评价的公正性和客观性，再加上诸多非学术因素的影响，致使同行评议的科学性和公正性受到越来越多的质疑与批判。

　　　　20 世纪80 年代以来，随着科学计量学的兴起和科研计量评价共识的增加，越来越多的科研机构和管理部门将科学计量学和文献计量学方法引入科研绩效评价和研究人员绩效评价中来，并作为科研管理与科学决策的重要依据。90 年代中后期，许多管理部门和研究人员开始探索借助科学计量分析的方法评价哲学社会科学成果，南京大学研制的中文社会科学引文索引（CSSCI）就是其中之一。目前，该数据库已经成为我国主要的哲学社会科学评价工具之一。定量化评价引入哲学社会科学领域之后，在科研管理中得到了广泛应用。

　　　　任何一种评价方法都有其适用的范围。在一定范围内，它显现的主要是优点，而一旦超出这个范围，就很容易出现问题。定量化评价方法也是如此。在全面、完善、公正、科学的哲学社会科学评价体系还没有建立的情况下，一些高等院校和科研机构出现了将定量化评价方法简单化和过度应用的现象，因而定量化评价方法也遭到了越来越多的非议与责难，甚至把哲学社会科学研究领域的一切问题都归罪于定量化评价。有很多文章罗列了定量化评价方法的弊端，有的竟达九种之多：一是“激励短期行为”；二是“鼓励单打独奏”；三是“助长本位主义”；四是“强化长官意志”；五是“滋生学术掮客”；六是“扼杀学者个性”；七是“推动全民学术”；八是“诱发资源外流”；九是“误识良莠人才”。还有人直接把它视为“学术评价的鸦片和罂粟花”。

　　　　其实，哲学社会科学领域存在的诸多问题并非都是定量化评价的结果，而是由多方面原因所致。概括来说，这与我们所处的大环境（如市场经济的大环境、社会转型的大环境）有着内在的联系。在这样的大环境下，即使我们不引进定量化评价方法，很多问题同样还会出现，除非我们不去鼓励和推动哲学社会科学的发展，从而放弃对哲学社会科学的一切评价。事实上，只要我们还坚持发展哲学社会科学，就绝不可能放弃对它的评价；而要开展哲学社会科学评价，定量评价与定性评价都不能偏废。

　　　　任何事物都是质和量的统一。定量评价与定性评价也是相互联系、辩证统一的。就哲学社会科学研究成果的评价而言，通过同行评议来实现的定性评价，虽然是对研究成果内容的评价，但也须以相关的“量”为基础，至少不能无视量的因素，包括出版单位的级别或期刊的地位（影响）、成果的数量与反响（转载和被引用等），乃至作者的相关研究情况等。同样，定量化评价也不是完全脱离质量的，量化的标准中实际上已内在包含质量标准。

　　　　以哲学社会科学研究论文为例，一般说来，中文社会科学引文索引（CSSCI）来源期刊的稿源质量较高、采用稿件质量要求较高、编辑队伍素质较高、审稿（包括匿名评审）制度较健全，从而所刊发的论文质量也相对较高，至少是高质量的论文所占比重较高。尽管对哲学社会科学评价中存在的过度量化问题批评不断，但对这一点还是没有太多疑义的。有鉴于此，在一般考核性的评价中，甚至包括在一些选拔性的评价中，如果采用了定量化评价方法，虽然标准是量化的，但这种量化的标准是以先期的定性评价（期刊的评价）为基础的，客观上是一种量与质相统一的标准。

　　　　针对哲学社会科学评价领域存在的关于“数量与质量相冲突”、“数量增长影响质量提升”等观点，有学者采用实证分析的方法对科研成果的数量与质量之间的关系进行过研究。该研究选用中国引文数据库，从个人和机构两个角度，取高被引作者前50 名和高被引院校前50 名作为统计样本，分别统计其发文量、被引频次、下载频次、H 指数等指标数据，进行相关性分析，结果显示，无论是在个人层面还是机构层面，发文量与被引频次、下载频次和H指数都存在着显著的正相关关系。由此表明，数量与质量并不冲突，拥有高被引频次、高下载频次和高H指数的作者或者院校往往同时拥有较高的发文量。也就是说，无论是高被引作者还是高被引院校，其质量和影响力都基于一定的数量优势。这也从一个方面说明了量化标准与质量标准的内在统一。

　　　　此外，由于定量化评价方法和评价标准因过度应用而被“妖魔化”，有的高校在哲学社会科学评价中改行“代表性学术成果”评价制度，将学术著作和代表性学术论文认定为哲学社会科学成果的两种主要产出形式，在其文科科研业绩考核中将“代表性学术著作”1部和“代表性学术论文”5篇作为“代表性成果”，并且不受评价周期的限定。笔者认为，如果说这种评价制度可行的话，那也只能限于高校。道理很简单，高校是以教学为主的，取消了科研业绩考核的量的要求，并不会直接影响教学。对于科研单位来说，如果也取消科研业绩考核的量的要求，那不知要养多少自诩“不求数量、只重质量、志在大家”的“懒汉”和“单位拿工资、别处干私活”的“能人”呢！

　　　　因此，我们在构建哲学社会科学评价体系的实践中，必须客观地看待和运用定量和定性两种评价方法、数量和质量两种评价标准，并且尽可能地把这两种评价方法和两种评价标准结合起来，切不可从一个极端走向另一个极端。

　　　　（来源：中国社会科学报）