注册 投稿
经济金融网 中国经济学教育科研网 中国经济学年会 EFN通讯社

朱富强:中国经济学研究要防止计量实证拜物教

  第一部分 计量分析的功效剖析

  近年来,随着新古典经济学教材在中国大学中的地位不断巩固,计量经济学以及实证分析就受到众多经济学人的鼓吹。就网络上的流传来看,前段时间盛传开洪永淼的《计量经济学的地位、作用和局限》,近来则又出现了陆铭的《把实证研究进行到底》,而青年学子则毫不吝啬地为之点赞。其实,只要基于思辨逻辑稍加审视,就不难发现这些文章的论断和说辞中充满了牵强附会和先验偏见之处。本文则不打算对这些文章的措辞、逻辑、证据以及轰动性标题进行批判,而直接提出这样两个基本问题:计量实证分析在理论上是否果真有这些学人所言的神效?计量实证分析在现实中的文章究竟是什么面貌?当然,笔者并不是要否定实证分析和计量经济学,其他文章将会讲述它们的价值,只是警示经济学子不要迷信计量实证分析,搞得像个拜物教似的,并由此来否定和打压其他经济研究方式。根本上,经济学的发展应该是多元主义的而非一元主义的,后者只是占支配地位的新古典经济学所打造的“科学神话”。

我们首先从方法论上剖析计量分析所潜含的分析。很大程度上,一些经济学人之所以如此鼓吹计量实证,就在于他们仅仅掌握了这些计量工具的使用,却缺乏更深层次的方法论认识,从而就会极力夸大自己的那些技能。

一、不可信的未来经济预测

作为一门致用之学,预测能力是检验经济理论的重要标准。证伪主义大师波普尔曾写道:“如果我们有一种可独立检验而又为真的理论,它就会为我们提供成功的预测(并且仅仅提供成功的预测) 。”同时,社会政策的有效性也是建立在合理预测的基础之上。正因如此,计量分析的预测功能为大多数经济学家所强调和推崇,现代经济学为此发展出了日益精密的计量工具,构设了日益复杂的计量模型,大量的计量分析充斥于报刊杂志。问题是,流行的计量分析果真具有可信的预测能力吗?

(一)预测在现代经济学中的地位

自波普尔证伪主义提出以来,主流经济学就赋予预测在经济理论的检验中以压倒一切的重要性,科学假说的评价完全在于它所包含的预测,而预言的重要性就在于它能验证科学理论。例如,弗里德曼就强调,经济学是一门实证的科学,其任务在于提供一套一般化体系以对环境的任何变化所导致的结果作出准确推测,同时通过衡量它推测的精确度、范围和一致性来评估其表现。按照弗里德曼的看法,实证经济学由语言与实质性假说这两部分构成的混合体。(1)语言旨在促进“系统而有组织的推理方法”,并提供判断实证科学是否合理的逻辑与事实标准。其中,形式逻辑标准可以判断某种特定语言的完备性和一致性,即,这一语言中的命题是正确还是错误;事实标准则可以说明“分析的文件归档系统”中的类别是否具有有意义的经验对应物,即,它们是否能被用于分析具体问题中的某个特殊种类。(2)实质性假说旨在“从复杂的现实中抽象出事物的本质”,并提供实证科学的终极目的以及检验标准。弗里德曼写道:“理论应当通过其意在加以‘解释’的那类现象的推测力来加以判断。只有事实证据可以表明它是‘正确的’还是‘错误的’,是可以被暂时‘接受’为有效的,还是应被‘拒绝’的”;也即,终极目标是推测,而唯一合意的检验标准则是将推测与经验相对照”。

尤其是,自基于假设-推导的数理分析模式遭到挑战后,现代经济学就快速转向了实证研究,试图通过对数据之间的统计和回归分析来为新古典经济学的理论提供经验支持,并由此来为其政策主张服务,而政策主张又与其预测功能有关。其中的最大推手是弗里德曼。弗里德曼指出,“任何政策结论都必然基于对‘做某事而不做另一事’所导致的结果的推测,而推测则必然或隐或显地基于实证经济学。当然,在政策结论与实证经济学的结论之间并不存在一一对应关系”,其中涉及到价值判断问题;尽管如此,“在当前的西方世界,特别是在美国,无偏见的公民之间存在的有关公共政策的分歧,主要地根源于对性的导致的积极结果的不同推测,从原则上说,通过实证经济学的发展,我们就可以消除这些分歧”,例如,“一个明显的而并非不重要的例子就是最低工资立法。……意见的分歧主要源于人们在推测方面的或隐或现的分析,这些推测的分歧主要涉及‘最低工资立法’这个特定手段在实现人民一致同意的目标的功效如何。支持者们相信,法定最低工资能够提高那些工资在最低工资线以下的工人的收入,同时提高某些工资在最低工资线以上的工人门的收入,而不会引起完全失业人口的增加或就业条件的恶化等消极作用,因此可以消除贫困。而反对者们则相信,法定最低工资将使失业人数增加,就业条件恶化,抵消了这项立法带来的就业者工资增加的有益影响,使贫困情况更加严重。”显然,在主流经济学家看来,通过实证分析的预测,这种分歧就会消失;因此,经济学的科学特征在于预测经济的未来,这也是经济学属于实证科学的必然属性。

然而,就迄今为止的记录而言,应用计量经济学的预测并不成功。一个明显的例子是,主流的新古典经济学模型几乎没有一个预见到了经济危机的出现。事实上,在2008年经济危机爆发之前,货币基金组织首席经济学家布兰查德还认为,经济学家们在认知上已取得了广泛趋同,并能够控制一切现实经济问题。2003年,诺贝尔经济学奖得主卢卡斯在美国经济学会主席就职致辞中宣称,预防萧条这一中心问题已经被解决。2004年,美联储行长委员会委员伯南克宣称,在过去大约20年的时间里,经济景观最显著的变化就是宏观经济波动的显著下滑,并将之归功于经济制定政策的改进。针对不断高涨的房价,美联储主席格林斯潘在2004年声称:全国性的严重的价格扭曲是极端不可能的;美国总统经济顾问委员会主席伯南克在2005年则说,房产价格的上升在很大程度上反映了强劲的经济基本面。

(二)经济预测失灵的两大原因

应用计量经济学的预测能力为何如此不理想呢?这里从两方面加以分析。

首先,从计量模型所依据的数据基础看

计量经济学的统计回归分析往往建立在历史数据基础之上,即使它正确地解释过去的变化大势,但也不一定能够预测未来发展。事实上,基于历史或现状的分析来预测未来走势,隐含了其他因素不变的假定。但显然,任何社会经济现象都是众多因素合成的结果,而且每个因素又都是极易变化的;尤其是,这些初始敏感性条件的存在,通过蝴蝶效应的放大往往会产生完全不同的结果。因此,即使计量分析结果忠实地描述和解释了过去情形,但它也并不一定能够预测未来,这里遇到预测的逻辑一致性问题。

从经济学说史上看,几乎没有一个计量经济学家预测到经济危机的来临,甚至很少计量经济学家会承认大规模经济危机爆发的可能。譬如,作为统计学家先驱,杰文斯就热衷于通过各种数据对经济季节性变动进行解释和预测,但是他的预测常常出现问题;如他曾担心稿纸短缺而买了一大堆稿纸,以至于他死了50年后他的子孙们也没有把它用完。再如,作为美国计量经济学会的第一任会长以及经济学会和统计学会会长,费雪也根本预见不到1929年的经济危机而投资失败,最后只能回耶鲁教书。与此形成鲜明对比的是,一生热衷于经济学之人文和历史分析的凡勃伦却预见到了1929年的大危机,尽管他在此之前不久因穷困潦倒而死。同样,同时代奥地利学派的米塞斯和哈耶克也预见到了即将发生的经济危机,而他们的基本经济思维就是反对实证主义。

实际上,经济学说史上预见到经济危机并提出告诫的经济学家,如劳德代尔、马尔萨斯、西斯蒙蒂、马克思、凡勃伦等,几乎都是拥有深厚的历史和社会科学功底而不是热衷于数理分析的认;相反,热衷于抽象逻辑思维和纯理论构建的李嘉图、萨伊、古诺、杰文斯、瓦尔拉斯等人,却都极力否认大规模经济危机的可能。同样,迄今为止的资料也表明,基于逻辑实证主义的新古典宏观经济学理论在预测方面是非常失败的。那么,为什么会出现这种“弔诡”呢?究其原因有二。

第一,热衷于研究纯经济理论的数理经济学家往往过分扩大了人的理性能力,以致其研究思维为特定框架所限,产生了“一叶障目不见泰山”效果,反而看不清宏观经济学变动。例如,新古典经济学就将研究局限于既定制度下的资源配置,并用边际分析来探究最大化和均衡,这种均衡分析当然也就看不到经济现象内在的矛盾和冲突。事实上,新古典经济学得出的理论与凯恩斯的失业理论之间就是矛盾的,以致布坎南认为,把经济学局限于资源配置层面的新古典经济学“不是推动着而是阻碍着科学的进步”,经济学本质上要研究“人类关系制度”。相反,那些热衷于经济史分析的古典经济学家则往往基于平均分析来研究经济现象,并借助制度分析来探究这种平均出现的深层原因;正因如此,它可以深刻地揭示不同利益群体之间的冲突,从而在一定可以挖掘经济活动的一般趋势。

第二,复杂多变的人类社会现象根本不是可以通过计算理性得以刻画的:(1)数理模型只能抽象地表达一些简单的社会现象,因而绝大多数的经济问题都是不适合用纯粹的数学逻辑来表达的;(2)计量模型也仅仅显示过去数字之间的初步联系,反映特定时期事物发展的总体趋势,而根本无法解释事物之间内在的因果关系。事实上,即使经济学家根据世界粮食产量的减少而预测粮价会大幅度上升,但是,他们根本无法确定粮食会上涨到什么程度,更不能预测粮价何时将达到某个价格水平,而简单地预测粮价上涨则根本不需要现代经济学的专门知识。同样,在早期房价上涨中,一些学者不断鼓吹房价降上涨到某一价位,但从来没有预测到准确的房价水平,更没有预测最高位的时间;而在目前房价下跌中,这些学者又出来预测房价将进一步下跌,但跌到何种程度以及何时到达底部的预测却充满了巫术性。

其次,从计量模型所依据的理论逻辑看

计量经济学的相关性分析只能关注那些同质的数量间关系,却忽视了无法观察到或者无法量化的结构、机制和力量等因素,而结构、机制和力量等因素的改变将会完全改变事物的性质;这样,应用计量经济学的预测将适合特定时间、特定范围和特定物体的方法或手段运用到其他场合,就必然会造成了工具主义悖论。同时,计量经济学的同质性分析还充分体现将行为者还原为理性的原子个体,却不考虑行为者所面临的不同环境和不同目标,从而就无法不能预测面临特定情景下的具体行为。

第一,正是由于流行的计量模型恰恰缺乏结构的变化,从而往往就会得出廉价而无效的结论。例如,基于货币数量论模型,弗里德曼认为货币供给的增加必然会导致物价上涨,并提出以货币数量为目标的宏观经济政策。但显然,这种政策从来没有成功实现过,连弗里德曼本人后来也不得不承认。谢拉.道就指出,“结构变化的可能性往往使预测蒙羞,对公共政策效果的预测需要警惕结构变化的可能性,同时,政府也可以把结构变化安排作为公共政策的一项措施,这项措施需要基于对结构变化效应的预期。”

关于基于计量分析进行预测的荒唐性,我们可以看一则笑话。一位经济学家搭乘一架四引擎飞机由纽约飞往伦敦,途中飞机撞击一个不明物而开始下坠;此时,飞行员告诉乘客们有一只引擎坏了,他们到达伦敦的时间将延迟半个小时;过了一会儿,同样的事情发生了,飞行员又一次告诉乘客第二只引擎坏了,飞机到达时间将延迟一个小时;在后来,事情再一次发生,第三只引擎也坏了,现在飞机到达时间将延迟五个小时。此时,经济学家转过身来对后排的乘客说:“按照这样的比率,如果最后一只引擎坏了,我们会整夜呆在这里。”这是嘲讽经济学家的一个笑话。其实,每一次引擎的失灵都造成飞机结构的变动,而第四只引擎的失灵将导致飞机结构在质上的变化,并由此完全改变飞机的性能,而计量经济学家的工具主义思维却根本无法认识这一点。

第二,正是由于流行的计量模型建立在理性分析的基础上,即使它以对行为者的过去行为、性情以及其他特征的观察为基础,也依然无法把握未来的不确定,因为个体总是根据不断变化的环境来重新调整自己的行为动机。很大程度上,新古典经济学家之所以无法预测经济危机的来临,就与其坚持的市场有效理论有关,而有效市场理论又是以理性模型为基础,不管过去行为如何,都假设未来的行为是理性的;相应地,极端事件只发生在过去,经济大萧条已经永远成为历史而不会再重演。譬如,布莱克-默顿-斯科尔斯的投资组合风险预期模型就适用于稳定的市场环境,并据此长期资产管理公司(LTCM)取得了骄人的业绩;但它在市场条件变得不稳定时的预测却很不好,而长期资产管理公司坚信该模型有能力消除风险,因而在1998年亚洲金融危机中继续购买,结果以破产告终。

关于计量模型中理性假设的缺陷,我们也可以看一则史库森举的例子。史库森问道:“一位宇航员能够知道太阳升起的准确时间,但是有人能预知一个学生早上会几点起床吗?如果他8点上课,那你就会确定他会在7点起床并在8点前达到学校。你或许在几个月时间内研究过他的作息习惯,并且在它的作息习惯基础上,你会在一定程度上断定他会在7点起床8点上课。但是仍然存在不确定性。如果他生病了或者他的定时钟没有响怎么办?如果他家里有人去世了,他必须呆在家里怎么办?可以有无数理由使那个学生没有按你预期的那样行动”。在这里,预测的关键在于环境,经济学的理性预测往往依赖于稳定的环境。

(三)对经济预测的科学主义误导

基于计量实证来进行预测本身就存在这样两大逻辑缺陷。(1)流行的计量分析往往使用线性回归,或者是体现某种固定趋势的回归;但是,现实世界中事物之间的影响往往是非线性的,甚至是跳跃性的,从而就无法为计量分析所刻画和预测。(2)统计回归分析的对象主要是宏观事态,它基于大数定律得出的一般状态,而将任何独特的事件都通过置信区间的设计而排除在外;但是,经济现象中最为重要的预测事件恰恰是其独特性,如经济危机何时来临等,这却在计量分析过程中已经被排除了。也就是说,基于经验材料的计量分析所获得的根本上是具有特殊性的统计规律而非普遍性的经济规律,它主要反映变量在数量上的某种相关性,最多体现了特定时间或范围内变化的一种常规大趋势

但在现实世界中,最有价值的预测恰恰体现在发现事物的变异以及可能造成的危害,而不是陈述一种常规。就当前中国经济发展而言,经济学家应该提供的不是按照以往的经验和数据预测中国每年8%左右的GDP增长率,而是要预测明年是否会出现大的经济衰退乃至经济危机,但迄今为止还没有什么模型能够对经济、金融危机做出成功的预测。

问题是,在现实世界中,最有价值的预测恰恰体现在发现事物的变异以及可能造成的危害,而不是陈述一种常规。就当前中国经济发展而言,经济学家应该提供的不是按照以往的经验和数据预测中国每年8%左右的GDP增长率,而是要预测明年是否会出现大的经济衰退乃至经济危机,但迄今为止还没有什么模型能够对经济、金融危机做出成功的预测。事实上,对社会经济现象来说,试图借助一个模型来作出有效且精确的预测,不仅是非常困难的,甚至是不可能的。哥伦比亚大学金融工程学系主任伊曼纽尔.德尔曼就指出,模型无法像理论那样描述或揭示维系世界如何运作的基本原理,而仅仅告诉某个东西很像什么;而且,模型中一定存在简化,从而很可能会省略该事物的某些性质。譬如,有效市场模型将股票价格变化类比于房间里的烟雾扩散并用物理扩散原理来进行计算,但这样的类比存在严重缺陷,因为它以某种形式将人类行为“拟物化”了,从而免除了进行复杂思考的麻烦。问题在于,如果人类行为会完全遵守数学法则,从而把有着诸多限制的模型与理论相混淆的话,其结果肯定会是一场灾难。因此,德尔曼强调,我们根本不可能发明出一个能够告诉我们股票价格将会如何变化的模型。

致力于对人类行为进行系统分析的是奥地利学派。奥地利学派强调人类行为的意向性和目的性,认为未来事件取决于尚未被创造出来的企业家知识;相应地,只有对干预产生的非协调结果进行定性的、理论的模式预测,这才是可能的。既然如此,我们是否就应该放弃经济分析的预测功能呢?也不是。事实上,我们可以挖掘和发现现实社会经济中存在的问题,剖析这些问题产生的原因,揭示问题不断加重的趋势,从而可以预测未来会爆发危机的可能性。在很大程度上,这也是一种预测,只不过这种预测不是基于抽象模型的随机游走,而是要揭示危机不断累积及爆发的内在机理,从而具有更为强大的解释力和预测力。同时,正是由于发现了现实社会经济中内在的问题以及作用机理,那么就可以在问题爆发之前解决这些问题,从而避免危机的爆发。显然,这正是经济学理论应该关注和探究的课题,这个探究过程需要充分地挖掘事物的本质,分析现实的异化,尤其是要分析人类的行为机理,关注人类行为的意向性。

就现代主流经济学而言,它也试图模仿自然科学而把演化生物学视为追随的对象。问题在于,人类社会的演化也根本不同于自然生物的演化。一般地,生物的演化往往是被动适应性的,因而往往可以通过考察自然环境的变化探究它的演化轨迹;相反,人类社会的发展本身是有目的的,它往往可以主动地实施变异和创新,这些都不是数理模型或计量分析所能揭示的。不幸的是,尽管社会经济现象本身如此复杂多变,现代主流经济学却采取了简单化的做法:把经济人视为普遍的行为准则,并以数学化的工具打造成一个自洽性的理论体系。这样,经济学就不仅离开了人文的关注,也逐渐离开了演化生物学的基本要求。正如弗里德曼所说:我们把尊重留给马歇尔,但我们追随瓦尔拉斯。正是由于现代主流经济学忽视了经济现象的特性,使得一群数理能力超群的人热衷于模型构建,从而导致了理论与现实之间就越来越相脱节;同时,由于随着数理模型的缺陷暴露,越来越多的经济学人转向了所谓的实证分析,并以此来进行预测。

显然,大多数经济学论文都严重误解了经济理论的预测性要求:它不是将预测建立在对问题发现的基础上,而是对过去数据的计量分析之上。尤其是,在当前经济学界,越是知识狭隘的人,往往也越热衷于基于计量分析进行预测,从而也就留下了一连串的失败记录。在很大程度上,这反映了经济学中浓厚的科学主义自大。譬如,弗里德曼认为,一个理论的好坏取决于该理论的预测能力,这就是基于科学主义的标准。问题是,经济系统中充满了不确定性,尤其是人类行为本身具有难以捉摸的意向性,用反映过去的“统计规律”来预测未来几乎是不可能的。姚洋甚至认为经济预测要比天气预报难的多,因为尽管天气变化中的不确定因素也很多,但天气不会对天气预报做出反应,因而天气预报随着预测技术的改进而日益准确;但是,经济预测必须面对能够做出反应的公众,从而永远不可能做到和天气预报一样准确。同时,科学主义的自大使得经济学人热衷于将其结论运用到社会实践中,进一步主张了经济学研究中的实用主义和功利主义取向,这对经济发展造成更大的灾难。

更为甚者,功利主义之风的盛行又使得经济学人的“实用主义”不是体现在对社会发展上,而是体现在对自身利益的影响上。结果,当前绝大多数的计量实证都不是严谨的,不是对现状的真实描述,而是充满了获取个人利益的功利目的。北大计量经济学教授朱家祥在博客中曾调侃说:用计量模型来进行经济预测面临着双重风险:模型的风险与延伸的风险,因此,要在此高风险的行业中生存必然要有些手段,这种手段包括:(1)发布“点预测”(point forecast),省略标准差或区间预测的数据;(2)为了避免立即的窘态,少做短期预测,多进行中长期预测;(3)如一定要做短期预测,要诀是多预测;(4)预测的标题要耸人听闻,以获得媒体的青睐,如道琼3万点,油价120美元;(5)评估预测绩效时,使用不对称的成本函数 (扬善隐恶的成本函数);(6)名气不够大的,要避免成为第一个提出预测数据的人;(7)随时准备好:如何在明天解释为什么昨天的预测在今天没有发生;(8)如果没有计量模型可用来预测,计算其他人预测值的平均数;(9)一夜成名的手段是持续发布极端的预测;(10)我最好赶紧住嘴,免得触怒了所有的预测专家。

总之,尽管主流的实证主义者极力强调理论的作用根本上体现在对经济现象的预测上,理论的优劣体现在其预测能力而不是解释能力,但流行的计量分析却并不具有实质性的预测功能。究其原因,(1)计量分析本身是基于过去的数据,以此来预测未来就会犯工具主义的错误;(2)计量分析将各种数据平均化而忽视了那些特异性表征,以此得出的只是对实践并无实质用途的常规现象。从实践看,迄今为止的实证分析在预测方面也没有取得预期的成功。例如,2008年爆发的经济危机就没有为任何计量模型所预测到,以致英国女王访问伦敦经济学院时就向经济学家们提出“为什么没有人预见到信贷紧缩”这一“女王难题”。正是基于过去的失败记录,人们还编排不少笑话来嘲笑现代经济学,如经济学家预测出了过去5次衰退中的9次,经济学家随时准备在明天解释为什么昨天的预测在今天没有发生;还有人总结计量经济学的四条黄金定律:大胆地思考,不受限制地创造,出奇地幸运,做不到的话就下决心当一位经济理论家。

二、不可行的应用经济政策

剖析了计量分析的预测功能后,我们再来看它指导实践的应用功能。事实上,无论是对现象的解释还是对未来的预测,根本目的都是为了指导实践和改造现实。为此,大多数经济学人都致力于通过计量分析来发现社会经济的变化趋势,不仅以此来预测社会经济现象,而且据此开出具体的政策建议。问题是,计量实证主要是对历史和现状的实然描述,由此可以获得应然的政策建议吗?

(一)计量结论的应用局限

事实上,即使计量分析果真如实地描述了现状,我们也无法简单地用于指导实践。究其原因,迄今基于经验材料的量化分析所揭示的根本上都只是具有特殊性的统计规律而非普遍性的经济规律:前者主要反映变量在数量上的某种相关性,最多体现了特定时间或范围内的变化趋势;后者则主要反映事物之间在相互作用上的因果关系,需要深入事物的内在结构和作用机理。更为甚者,计量经济学的回归分析还具有这样两大特点:(1)它将任何独特的事件都通过置信区间的设计而排除在外,从而通过熨平那些跳动的数字而将各种数据平均化,由此揭示出的必然是一种常规大趋势;(2)它的分析结果还主要是基于过去数据的统计或计量,从而仅仅体现了历史观察数据的延续却无法预测未来的跳跃性变化,由此所揭示的仅仅是过去的变化大趋势。

正因如此,应用计量经济学的政策价值就存在严重局限。

首先,尽管计量分析获得了一种变化趋势,但这种趋势往往只能揭示出常规趋势。

显然,常规趋势不仅忽视和抹杀了那些特异性表征,而且也就无法预测那些变异和独特事件的发生,从而对社会实践并无实质指导价值。事实上,计量分析告诉人们的往往是一些并不需要通过计量分析也能了解的常规现象,如果没有其他大事件的发生,明天、下个月或者下年度的经济发展就如今天、上个月或上年度类似。问题是,人们最为关心的是那些特异性事件何时、如何发生,又会产生何种影响,而这方面计量分析却无能为力。利特尔就指出,“在社会科学中,我们不是要发现能够使我们对社会现象间的因果性充满信心的那些规则和规律形式,相反,我们发现的是发展趋势的规律和各种例外性规则。”

同时,在现实世界中,所有具有划时代意义的重大事件都是各种矛盾交织纠结而成的产物,都处于惯常的运行轨道之外。Taleb将这种偶合事件称为黑天鹅,这些黑天鹅是可以产生巨大影响的小概率事件,它为数不多却几乎能“解释世界上的任何事情”。但是,迄今为止的经济模型几乎都无力预测这种黑天鹅是否会以及何时何地出现。譬如,目前世界各国银行风险管理模型都是以有效市场理论为基础的,它们把未来可能发生的事件建立一系列概率,并以正态分布表示,如布莱克-斯科尔斯期权定价模型就是如此;但显然,这种钟形的正态分布往往对较大偏差忽略不计且无法处理它们,从而也就忽略了极端事件发生的可能性。也就是说,现代经济学的预测模型所提供的不确定测量工具将黑天鹅置之度外了,从而就导致在环境变化时的失效;尤其是,这种模型还进一步使人误以为他们已经控制了不确定性,从而进一步丢弃了不确定性的直觉把握。

其次,计量分析获得的是过去的变化大势,而无法预测变动不居的社会经济现象之发展。

显然,以过去趋势来预测未来和指导社会实践就会犯工具主义的错误。事实上,任何社会经济现象都是由众多极易变化的因素合成的结果,以致每个历史事件必然是不同质的,从而也就不能被用于检验或建立历史规律、数量规律或其他形式的规律。但是,流行的计量经济学却试图盲目仿效自然科学,把复杂和不同质的历史事实当作可重复的、同质的实验室材料,把每个事件的质的复杂性压缩成一个数字,然后错上加错,把这些数量关系看做人类历史中的不变关系,从而必然会严重误导对社会发展的认知。

为此,无论是奥地利学派学者还是凯恩斯学派学者,都对简单化的应用计量经济学持强烈的批判态度。如米塞斯就指出,“我们能够观察的每个数量都是一个历史事件,是不指明时间和地点就无法充分描述的事实”,而“统计数字是论及经济时间的历史资料。它们告诉在某个不可重复的历史情况中发生了什么。我们能够基于我们在实验中确定的不变关系来解释自然事件。(但)历史事件拒绝这样的解释……”。即使是凯恩斯,他一方面对统计数据显示的事实高度重视,另一方面对用统计方法来预测未来的经济计量学又持明显的怀疑态度。在凯恩斯看来,统计学不是给回归系数提供数据,而是为经济学家的分析提供直觉素材。而且,凯恩斯还曾强调,数据信息如果落到一个没有经过哲学训练的人手中,将变成危险而误导的玩具。事实上,正如诺思指出的:“如果我们不断地创造全新的世界,我们从过去经验中形成的理论能在多大程度上应对这个全新的世界呢?”

(二)计量应用失败的经典案例

基于上述两大原因,简单地将计量分析的结果应用于社会实践就必然会遭受失败。关于这一点,经济学说史已经给出了大量例子。

例如,杰文斯既是一个经济学家又是一个逻辑学家,同时又在经验科学和统计科学作了重要探索,《太阳周期与谷物价格》和《煤炭问题》等都涉及到对数据的分析和解释。事实上,杰文斯长期也以统计学家的地位被列入史册,凯恩斯就指出,杰文斯的归纳研究标志着“经济科学的一个新阶段的开始”。但是,尽管杰文斯的第一部著作《煤炭问题》为他赢得了声誉,但这实际上也是一部属于杞人忧天和马尔萨斯主义的著作:该书估计了英国煤炭的现有储量和煤炭消费的增长率,认为需求将持续增长而煤炭储备量却将日益衰竭,结果只能导致煤价急剧上涨和英国经济增长的停止。正是基于杰文斯的研究,一时间关于行将到来的煤炭短缺的故事充斥了英国的各家报纸,一个专门调查该问题的皇家煤炭委员会也宣告成立。然而,尽管杰文斯估计到1961年时英国的煤炭消费量将达到26.07亿吨,但1962年英国实际使用的煤炭数量却只有1.92亿吨;究其原因在于,杰文斯没有预见到煤的替代品的发展,如石油、天然气、水力发电等。除此之外,杰文斯也因担心稿纸短缺而买了一大堆稿纸,以至于他死了50年后,他的子孙们也没有把它用完。

同样,费雪在20世纪20年代曾被称为“华尔街的先知”,但根植于基于肯定性理性的乐观主义,费雪看不到经济繁荣背后的问题,不仅在1929年股票市场崩溃的前一周还坚信华尔街的股价踏上了“永久的高原”,而且紧接着经济崩溃后也仍相信华尔街的衰败不会持续时间太长;因此,他大量买进股票,以致所有的投资都被低迷的市场彻底吞没,最终以负债累累淡出了公众视野。为此,赵峰评论说,“费雪最初成为百万富翁依靠的是技术发明而不是经济学,但他最终的失败却与他的经济学有一定关联。”同样,默顿和斯科尔斯利用其期权定价公式来炒买炒卖各国债券,却无法预见1997年的东南亚金融风暴而导致长期投资公司的破产;究其原因,他们发明的期权定价公式基于历史数据而将德国债券与意大利债券的价格变动视为正相关,但金融危机的爆发却使得两国债券价格变成了负相关。正因如此,我们必须充分认识到现代主流经济学基于计量分析所得出结论的局限性,不能简单地运用于对现实实践的指导和对经济发展的预测。阿里巴巴董事局主席马云就感慨地说,经济学家首先是个数学家,他主要是对数学模式有兴趣,对昨天的数据有兴趣,但让一个对昨天有兴趣的人去判断未来却是悲哀的;因此,企业家不要听经济学家的话,否则就死掉一半了。

最后,即使计量分析强化了因变量和自变量之间的逻辑联系,但它也不能打通从实然到应然之间的鸿沟,从而无法从中获取政策建议。究其原因,描述现状的实证分析仅仅给出了“是什么”,而政策建议则必须给出“应该是什么”,从“是什么”是得不出“应该是什么”的。同时,实证分析发现的现状往往并非合理,以此指导实践只会进一步强化不合理。譬如,我们在计量分析企业治理时,发现政商关系对企业发展影响很大,那么,我们由此可以得出企业应该在加大政商关系的投资吗?事实上,政商关系往往成为腐败之源,是导致社会资源浪费和制度成本飙升的重要方面。同样,我们在计量分析地区经济发展时,发现官员调动与经济增长速度之间存在正相关,那么我们就可以鼓吹官员流动吗?事实上,官员流动过快往往会导致竭泽而渔地提高GDP,甚至还会出现商人跟着官员走的现状。在很大程度上,现代主流经济学之所以凭借实证分析来提供政策建议,根本上它存在社会达尔文主义的先验价值观,以所谓的自然秩序、市场竞争作为“应然”标准,根据自然界的“物竞天择”原理来为社会竞争的结果进行辩护;结果,就不仅合理化了实证结果,而且以实证分析来为现实制度和强者行为辩护。

总之,尽管流行的应用计量经济学强调通过社会经济规律的揭示以及未来发展趋势的预测来指导社会实践,但实际上,不仅其中内含了无法克服的逻辑缺陷,而且历史实践的成效也并不好。事实上,实证主义和经验主义方法论在自然科学中远比在人类社会科学中更为适用:(1)与自然现象的相对稳定性相比,社会经济现象中根本就没有不变的常量,人的意志、知识、价值观和社会关系等总是在变化;(2)与物理学等自然科学不同,黑天鹅在人类社会的发展中往往起到关键作用,经济科学也被这些罕见和极端的事件所主宰。因此,运用计量分析工具来揭示社会经济规律、并以此来预测未来事件和指导社会实践就存在无法克服的缺陷。相应地,在进行使用计量模型分析时应该持有两个基本注意点:(1)不能简单地依据统计规律来预测未来,因为未来很可能因新事件的出现而产生变化;(2)不能简单地依据统计规律来指导实践,因为这很可能因与现实相脱节而造成灾难。不幸的是,现代主流经济学恰恰将经济学等同于自然科学,并基于理性模型进行计量分析,从而就必然发现不了那些由偶发性事件作用而产生的经济危机,无法发现现实世界的问题,更不要说由此给出合理的政策建议了。

三、不足取的社会现象解释

在过去半个多世纪里,基于计量实证的事件预测和政策应用都出现了严重问题,这导致纯“理论”经济学家对应用政策的兴趣顿时锐减;相应地,现代主流经济学的目标定位又出现了转向:不再期望基于实证分析提供精确的预测或有效的政策,而是提供一种“客观”的解释。结果,实证经济学日益蜕变为一门解释性的学说。问题是,计量实证对经济现象的分析可取吗?

事实上,越来越多的主流经济学家已经开始将实证经济学和应用经济学区分开来:实证经济学仅仅是对已有理论进行验证,同时对现状进行客观的描述。在他们看来,这种描述就像我们对自然界的现象进行描述一样,是可以达成一致意见的;相反,应用经济学则充满了价值判断和目标选择,这都带有非常强的主观性和不科学性。所以,哈奇森就说,经济学“不可避免地成为一个在很大程度上、或者完全与政策无关的学科”。而且,弗里德曼认为,尽管由于“经济学处理的是人类之间的互动,并且研究者本身就是研究对象的一部分。和自然科学相比,研究者和研究对象的关系更加密切,这些事实给经济学的‘客观性’带来了特殊的困难,与此同时,它也给了社会科学家一系列自然科学家得不到的数据”,“实证经济学是,或者说能够成为一门自然科学意义上的‘客观’科学。”

问题是,经济学不仅在研究对象上与自然科学存在很大不同,而且在研究方法上也与自然科学存在明显差异,那么,现代主流经济学又如何认定,实证分析不包含价值观、从而在解释上总体上是客观的?一个明显的例子是,不同学人对同一事物的实证结果往往存在很大差异,对同一实证结果所提供的解释甚至也会截然相反。显然,这些都表明,不存在绝对客观的纯粹实证分析,基于实证分析对社会现实的解释也并不一定合理。关于流行实证分析中存在的片面性和狭隘性,可以从如下两方面作一剖析。

(一)实证分析所揭示的变量关系具有随意性

一般地,经济实证分析仅仅反映了基于特定侧面对现象进行解释的功能性联系,而没有揭示事物之间相互作用的内在机理;同时,由于对纷繁复杂的社会因素了解不够,人们在实证分析时所选择的工具和确定的变量往往并不合理。相应地,即使经济计量分析确实揭示了不同现象间的影响关系,但是,这种关系往往要么是功能性的,要么是蜕化因果性的;由此得出的结果不仅无法解释内在的作用机理,更难以挖掘现实问题的根源。

首先,就实证分析的功能性而言,它往往将两个变量独立开来,甚至因变量和自变量也是可以随意置换的。正是这种变换的随意性,往往会产生种种的相互矛盾的结论。例如,在利率与储蓄的正向关系上,如果随意变换两者的位置,那么,我们不仅可以得出储蓄将随利率的提高而增加,也可以得出利率将随储蓄的增加而上升。显然,后者违背了一般常识,但数学符号的运算确实可以得出这样的结论。再如,更为熟视无睹的例子是,现代主流经济学认为,市场机制可以调节供求从而实现市场平衡,因为价格与供求之间存在稳定的关系;但问题是,究竟是价格影响供求还是供求影响价格,却存在截然不同的两种解释,从而会引导出迥异的政策。事实上,瓦尔拉斯在市场出现非均衡时将价格视为调节变量,其需求和供给函数的形式为:

 t.png,       t.png;相反,马歇尔则集中在数量上,视数量为调节变量,其需求和供给函数的形式为:       t.png,       t.png。显然,在供给曲线和需求曲线都向右下方倾斜的情况下,马歇尔均衡条件和瓦尔拉斯均衡条件是不一致的。

同时,计量分析对两个变量之间关系的研究主要集中在这样三大方面:(1)是否有关系?(2)关系的强度如何?(3)关系为何种形式?但是,这三方面检验都存在明显的主观性和随意性:第一、二点往往依赖于检验的方法,不同的方法甚至会得出截然相反的关系;第三点则依然于模型的设定,不同的回归方程往往会得出不同的关系形式。尤其是,对社会经济现象进行计量建模尤其困难。(1)社会因素错综复杂地联系在一起,但基于简约性原则,经济计量模型往往将一些非常重要却无法量化的变量舍掉;因此,变量的选择本身就具有很强的主观性,从而很可能得到荒谬的实证结果。(2)社会经济现象的研究关键是要揭示因果联系,但流行的计量模型在选择因变量和自变量时往往基于时间先后,这就很可能颠倒了因变量和自变量的关系;同事,很多变量也很难在时间上显示出来,乃至不同的计量模型往往会随意调换因变量和自变量。上述种种都表明,尽管计量实证看似给出了“客观”的数据分析,但其中却充满了非逻辑的因素。

其次,即使目前的实证分析努力揭示事物之间的因果联系,这种因果关系往往也是蜕化的,仅仅把因果性看做是两个独立实体(一个原因和一个结果)之间的外在关系,从而在所有的自然领域和社会领域都普遍有效。一般地,这种理解的因果关系是以休谟的因果分析为基础,所谓因果关系只不过是在时间和空间上碰巧相邻接的两个事件之间的固定关系;其中,时间上在前的事件被称为在后的事件的“原因”,在后的事件被称为“结果”,虽然在这两个事件之间并不一定有什么联系。显然,休谟的因果法则面临诸多的问题:(1)人类社会中的诸多事件并不是分割的,而是共生在一起,根本分不清出现的时间先后;(2)即使事件之间存在先后关系,但也不一定是相连出现的,其间可能存在相当长的时滞,而这种时滞往往又是不确定的;(3)在人类社会中,很多现象是由人的心理作用所造成的,而这无法通过观察获得;(4)大多数社会经济现象本身就是内生的,它们往往互为因果而不能简单确定谁因谁果,从而也根本无法通过相关性得到解释;(5)休谟本人也发现了因果机制中存在的逻辑问题,后来经过波普尔的阐释,归纳问题成为科学划界的阿基里斯之踵。

事实上,正是由于西方社会基于自然主义思维把世界上的物件视为各自独立而不相统属的,从而就把事物之间的因果机理机械化了;而且,在实用主义的哲学支配下,弗里德曼等将又将卡尔纳普等发展的严格化的归纳逻辑应用到了经济学中,从而为现代主流经济学的实证化倾向奠定了基础。问题是,尽管这种理解相对适合于自然领域,而将之拓展到社会领域则会出现严重缺陷;究其原因,人类行动并不是简单的刺激与反应的关系,而是包含了大量的意向性。正因如此,不同于现代主流经济学将人类行动看成外在于它们的原因的结果,马克思将因果性解释为:代理人的活动与活动的客体之间的一种内在关系。显然,正是基于功能性联系的研究,现代主流经济学往往把要研究的变量与其它因素割裂开来,并从外部关注可变量之间的关系,从而也就无法揭示事物之间的因果作用机理;而且,正是由于割裂了其他因素,现代主流经济学往往无法注意到初始条件的微小变化及其对未来产生的可能影响,以致其对社会实践的指导意义也大大降低。

(二)计量模型所设立的引导假定具有主观性

计量模型往往基于特定的引导假定,由此产生的实证分析和解释就形成了不可通约和不可交流的解释共同体。结果,按照不同解释共同体的经济学理论,同样一项经济政策,既可以解释为有利于增加就业,也可以解释为可能增加失业,关键在于由哪一位经济学流派或权威来加以解释,在现实生活中按照经济学家建议开出的政策也往往带来完全与预期相反的结果。同时,也正因为引导假定的变更往往会带来不同的解释,甚至获得不同的政策结论;因此,在20世纪80年代之后,在政府和社会公众心目中,经济学家简直成了巫婆神汉、占星卖卦之类的江湖术士。

当然,对解释的追求与其研究对象之间往往存在很大关联:(1)人类的行为动机和表现形式本身是多样的,这与后天的社会环境有关。就此而言,经济学中的解释根本不可能像自然科学那样客观。(2)对经济现象的描述往往并不仅仅是为了纯粹的解释,而是实现进一步改造社会的目的。就此而言,经济学中的解释也必然渗透着解释主体所赋予的一定价值观。例如,博伊兰和奥戈尔曼就写道:“人类行为不是在社会真空中产生出来的。相反,它们是由从政治到经济的社会机构网络中诞生出来的。这样经济机构可能会或者促进或者阻碍人类关于公正、自由基解放理想的实现。因此,它们必须接受道德的检验。这样的道德检验组成了经济研究不可或缺的一个方面,它可以被称为解放经济学。解放经济学的范围从解释特定的经济机构或经济理论产生的可组合利益的意识形态方面的研究,一直到激进的对于现存经济结构的道德批判。”

而且,当前流行的实证分析基本上都是基于新古典经济学框架,它的假设前提都源于不现实的新古典假设,因而片面性就尤其明显。例如,新古典经济学试图用一个统一分析框架来对人的行为及其经济现象进行解释,这显然排除了人类社会因素的多样性,增加了描述的机械性和僵化性。

首先,现代主流经济学有关人性的假设源于弗洛伊德的本能学说或华生的行为主义,它对对人性的分析和认知具有明显的还原论倾向,并且不具有可证伪性。波普尔在批判弗洛伊德精神分析法的伪科学性质时曾举例说,任何可以想到的病例和行为都能用弗洛伊德的理论加以解释:一个人为了淹死一个小孩而把他推入水中,另一个人为了拯救一个小孩而牺牲了自己的生命。按照弗洛伊德的理论,第一个人是因为“恋母情结”受到了压抑,而第二个人是因为“恋母情结”得到了升华。受之影响,现代主流经济学的解释也具有相似的特性,因而这种解释是不科学的。尤其是,现代主流经济学在本能主义基础上还对人性作了进一步的过度抽象,从而导致它对人类行为的事后解释甚至不如弗洛伊德等人的精神分析。譬如,当现代主流经济学看到雷锋做好事之后,往往基于效用最大化的教条开始把“助人为乐”视为雷锋的偏好,显然,这远远不如精神分析学派从其早期的生活环境来进行解释解释、预测更为合理。

其次,现代主流经济学对客观性的强调是基于对“科学”化的追求,但它对科学的理解明显受到自然科学的影响,从而明显具有科学至上主义的偏误。事实上,现代主流经济学热衷于通过计量实证来对社会经济现象进行“客观”解释,但实际上,几乎所有的解释根本上受到西方主流价值观的支配,从而根本没有所谓的纯粹实证分析。例如,博兰就指出,“那些主张特殊的经济政策(例如,私有化、解除管制,等等)的人,就是在主张并宣扬特定的社会价值观念。在随后的岁月中,由主流经济学家所表现的社会价值观念已经改变了许多次。有20世纪60年代主张实行凯恩斯的政府政策的主流派,有20世纪70年代的新保守货币主义,有20世纪80年代的反管制政策,以及20世纪90年代所倡导的更为偏激的要求缩小政府规模的反政府政策。新古典经济学家能够解释所体现出的社会价值观念的这种猛烈的摆荡吗?”

事实上,尽管弗里德曼及其信徒们遵循实证主义的研究路径,热衷于实证分析,强调实证经济学的科学性和客观性,把实证经济学视为独立于任何特定的伦理观和行为规范的;但是,在迄今为止的经济学中,从来就没有完全脱离规范的经济学,因为经济学研究的目标毕竟是为了指导社会实践。布罗西耶就指出,“无论是在李嘉图时代,还是在凯恩斯或弗里德曼时代,政治经济体制的发展总是与实际的和政治性的问题紧密相连的。在我们的时代,重大的政治讨论经常与一些基本的经济问题密切相关,例如失业问题、贸易保护主义与自由贸易的对立问题、健康保障机制问题、退休制度问题甚至税收的原则和体制问题,以及其他一些从来没有得到解决的问题。……把经济科学想象成完全可以预见和不带有任何偏见的显然是不可能的,因为这将不会对公民和政府提供任何帮助。”

总之,正是由于实践应用的失败,现代主流经济学转而试图将实证经济学打造成一门解释性的学科;但是,尽管模型越来越复杂,数据越来越庞杂,但其解释力并没有取得实质提高。张五常就宣称,他对宏观经济的解释和推断全部是用的,本科一年级可以学到的价格理论,而那些统计数字密密麻麻的回归模型的解释力则绝对是零。同时,基于实证分析的解释往往具有明显的主观性和片面性:(1)几乎所有的实证分析是建立在特定引导假定之上,因而本身也仅仅是一家之言;(2)基于实证分析对经济现象的解释往往是功能性的,它无法揭示经济现象之间的因果机理,从而也就无法对实际的经济运行提供可信的解释。尤其是,现代经济学并不是一个纯粹的经验科学,而是与特定时代的价值观结合在一起。相应地,现代主流经济学的实证分析也远非局限于对具体现象的解释,更不是致力于深化人们的社会认知;相反,它的主要目的在于论证西方社会主流价值观的合理性,为现代主流经济学理论提供证明和支持。关于这一点,艾克纳等人也曾做了分析:现代主流经济学的“目的并不是要在较大的社会有关的范围内对经济系统的实际运行作出解释——实际上它对此基本上是无用的——而是为在西方文明的历史发展中发挥过重要作用的一系列思想提供支持。”

四、没逻辑的经济理论检验

朴素的经验主义认为,科学始于人类停止思考、开始观察或实验的时候,这产生了孔德将实证主义视为最高阶段的科学三阶段发展论,也导致逻辑归纳和实证检验在经济学中的兴起。尽管朴素经验主义在兴起之初曾遭到科学界的普遍反对,但随着客观主义和纯科学理论的兴起,主流经济学逐渐偏重于描述“是什么”的实证分析;尤其是,随着越来越多的数学和自然科学出身者进入经济学界,他们使用日益高深的数学而传统的归纳主义方法精炼化,从而产生了逻辑实证主义。20世纪50年代弗里德曼将逻辑实证主义思维引入到了经济学中,从而导致实证经济学的兴起。

实证经济学强调,一个理论的价值可以通过它所取得的预测的精确度、覆盖率及一致性等指标来加以考察,而实证科学的最终目的就是 这样一种“理论”或“假说”,使之能对尚未观察到的现象作出合理的、有意义的预测。受实证主义思维的指导,20世纪 70年代之后,计量实证就逐渐成为主流经济学的基本研究方法,它逐渐排斥了那些形而上的思考;在现代主流经济学看来,只有实证方法才是科学的方法,其得出的结论才是客观可信的。固然,作为社会科学的理论研究离不开对经验事实的观察,计量经济学的目的之一也就在于检验理论能够在多大程度上吻合可以观察到的变量值。问题是,离开思考和内省的现象观察和计量实证能够“发现”和检验理论吗?

(一)热衷实证研究的误区

很大程度上,受西方主流经济学思维以及逻辑实证主义的支配,当前中国一些经济学人片面地强化实证研究,偏好于数据的处理;但实际结果却是,迄今为止的这些研究非但缺乏理论性,反而严重误导了中国经济学的理论研究。

这可从两方面加以说明:一方面,从理论角度上而言,几乎所有的文章都在模型化新古典经济学所提出的那些基本理论,或者通过一些计量实证的分析为这些理论提供经验支持,从而根本没有新的思想或理论出现;另一方面,从应用角度上讲,这些实证分析文章基本上都是抱着将主流理论套用到具体问题的目的,而很少从问题角度出发来选择更适合的分析方法,从而往往会产生刻舟求剑的结果。

正是由于囿于实证的思维,当前那些“主流”经济学人对现代经济理论的发展几乎也没有什么真正的贡献,甚至已经越来越少有经济学人能够真正去探究理论的根本特征以及理论研究的意义了。究其原因,正如布劳格感慨的,“经济学正在变得越来越技术化,这与经济学正在变得越来越抽象、不现实和脱离政策完全是两码事。然而,我认为,……,在最近的15~10年内,经济学家已经将技术和技术性本身作为研究的目标。……,更加关注理论计量学而不是应用计量学。……,令人吃惊的是,现在经济计量学已经从经济学系中分离出来,这真是个可怕的发展。”

更为甚者,实证研究促进了学术的大众化,进而使得经济理论发展呈现出明显的主流化趋势,进而导致现代主流经济学的研究范式也呈现出明显的自我增强效应。在这种情况下,主流经济学不但对其他的各种批判充耳不闻、熟视无睹,而且对当前急剧变化的社会环境也是反应迟缓,以致使得主流经济学的理论危机越来越严重。正因为中国一些经济学学者、学子如此盲从迷信于现代主流经济学的研究思维,沉迷数理模型和计量实证,而对基本的经济学直觉却不稍加训练,结果,反而使得自己对社会几乎处于一种“无知”状态。

(二)休谟“归纳问题”与计量

150多年前,休谟就提出了“归纳问题”:从有限数量的特殊事实无法得出普遍性的结论,因为总是存在一个无知领域,它有可能推翻那种自以为是的“一般规律”。一般地,从归纳得出的结论要有意义和具有合理性,就需要满足这样三个条件:(1)构成归纳基础的观察的数量必须很大;(2)观察必须在许多不同的条件下可以重复;(3)任何个人的观察命题都不应当与推导出的定律相冲突。由此,查尔默斯还进一步提出了归纳原理:如果在很多不同的条件下已经观察到的大量的A,而且如果所有这些被观察到的A无一例外地具有属性B,那么所有A都具有属性B。

不过,正如查尔默斯指出的,这三个条件也存在问题。譬如,“大量”本身是一个模糊的概念,当前计量经济学文章中所采用的数据算是大量的吗?显然,单篇文章的计量分析根本不能保证归纳得出普遍结论的要求,相反,任何普遍结论的得出都应该基于大量的相关实证文献上,甚至要建立在前人的知识积累的基础上。这也是前面强调的,理论并非来源于直接的实证,而是对他人和前人研究的归纳。查尔默斯也强调,“对科学来说恰当的事实,决不是直接获得的,而是在实践中构造的,它们从某种重要的意义上说是依赖于它们以之为前提的知识,而且,它们要经历修改和替换”。

正因为归纳本身存在逻辑上的缺陷,因而波普尔提出了证伪主义的替代物:理论仅仅是推测性的和暂时的猜想,它们需要接受观察和实验的严格和无情的检验,经受不住观察和实验检验的理论必须被排除,并被更进一步的推测性猜想所取代;从科学史来看,科学就是这样通过猜想-反驳机制向前发展的,只有适应性最强的理论才能够生存下来。但是,这种证伪主义依赖于一个标准:存在着一个逻辑上的观察命题或一组命题与另一个假说不一致,那么,该假说就是可否证的;而且,高度可证伪的理论,如果事实上没有被否证,那么就应该比低度可否证的理论更受欢迎。

不幸的是,由于现代经济学致力于在一系列的假设下构建一般性的理论,以致其理论很少能够满足被高度否证这一条件。正是基于高度的抽象,新古典经济学就建立了对人类行为分析的一个基本框架:每个行动都受某种最大化效用的驱使。譬如,当一个人面临落水小孩呼救的情境时,他可能采取两种行为:救和不救。一方面,如果他选择不救,那么,主流经济学就会强调这是对自私人的明显证明;另一方面,如果他采取了救的行为,那么,经济学同样可以说他本身的效用是“见义勇为”,从而也印证了经济学的自利人假设。结果,无论哪种结果,现代主流经济学都在事后提供了某种“自圆其说”的解释,却无法在事前告诉我们具体的个人究竟会如何行动。显然,这种学说就不符合证伪主义的条件。

(三)计量分析无法检验理论

鉴于上述分析,笔者强调,基于归纳的直接计量实证既不能简单地证实一个理论,也不能简单地证伪一个理论。关于这一点,我们这里可作进一步的阐述。

一方面,当检验结果与理论一致时,我们不能简单地认定理论被证实了,因为还有更多的事实并没有得到检验。例如,米塞斯就指出,“一个看来与经验并不矛盾的理论也决不能被看做是结论性地确证了的。伟大的经验主义逻辑学家穆勒不能发现客观价值论和经验事实之间有任何矛盾,否则他就不会正好在价值和价格理论急剧变革的前夜宣布,在与价值规律有关的范围内,无论是现在还是未来都没有再留下什么东西需要解释的;理论是极为完美的。”显然,这也是波普尔证伪主义对传统科学验证方法的批判。波普尔不仅否认归纳逻辑的有效性,甚至也否认进行归纳的可能性,在他看来,归纳仅仅是一种心理幻觉;而且,归纳方法对社会科学理论构建的局限性更为严重,因为社会科学中甚少会出现相同的事例,任何社会科学的理论本身就不是不精确。

事实上,社会科学理论往往有两大要求:(1)它更注重的是假设的合理性和逻辑的条理性,需要符合逻辑已执行要求,因为社会科学理论本身体现了主体者的认知和观察视角,每个理论本身具有一定的片面性;(2)理论的合理性尽管也需要经受经验事实的检验,但这更主要是指人类历史实践所积累的大数据,因而历史记录在预设前提的形成和修正中起到重要作用。举个例子,马尔萨斯的人口论建立在他精心的统计调查的基础之上,这包括关于每年结婚人数占总人口的比例,不同国家的出生情况,流行病对出生、死亡和结婚的影响等;正是在此基础上,他推断在较好的环境中人口趋向于每25年增加一倍,并评估了在世界欠发达地区及过去和现代欧洲不同国家中人口发展的差异。但是,随着技术的进步、物质的丰富、时代的发展和观念的改变,历史明显给出了新的事实,因而马尔萨斯建立在其统计之上的人口学说以及其他相应的经济理论也就遭受到了否弃。

另一方面,当检验结果与理论发生差错时,也不能简单地以为原先的理论错了,特别是,不能仅仅基于少量、局部的数据就推翻先前理论,因为任何理论都存在着一些不可屏蔽的假设条件。哲学家奎因1961年发表了对逻辑实证主义富有挑战性批判的经典文章《经验主义的两个教条》和物理学家杜恒1962年的著作《物理学理论的目的与结构》就提出了有关证据不足的奎因-杜恒命题(Duhem-Quine thesis):确定地证伪一个假设与证实一个假设一样困难,因为每一个假设的检验实际上都是关于所谈论的假设的数据资料的质量、使用的测量仪器以及对检验的特定环境进行规定的附加假设的一个联合检验;如果证伪发生,我们不能将罪过明确地归因于待检验的主要假设。显然,按照奎因的看法,理论本身是一个整体,因而不能单独地验证某一孤立的描述性陈述;相应地,科学知识的公理化不但需要公理而且需要所谓的“推理原则”,或其他使之运用于实践领域的条件。

事实上,几乎所有的科学理论都是由一组全称命题构成的,而并非是由像“凡天鹅都是白的”这样一个单一命题所构成。也即,绝大多数理论都存在一些辅助性假定,而检验并不能确定是理论错误还是源于某个辅助性假设条件。米塞斯就指出,“任何先验地相信自己的学说正确性的人总是能指出,对根据它的理论取得成功来说是根本性的某个条件没有得到满足”。证伪主义的提出者波普尔知道这一点,于是就规定了许多方法的标准或惯例来防止这种无休止的“免疫策略”:为了避免将来被反驳,可以修改被反驳的理论;但是,只有当这些修改增加了理论的经验性内容,从而使它更容易被证明是假的或者更易检验时,才可以这么做。问题是,包括经济学在内的社会科学理论所基于的条件根本上都是不可重复的,实验室控制的条件也必然与现实相脱节;为此,注重知识继承的积累学派就积极倡导库恩范式,而对波普尔开创的证伪学派进行批判。

总之,基于归纳的简单证实不意味着就能证明理论,纯粹的计量检验也得不出任何实质性的理论,这实际上已经成为学术界的共识。例如,积极将实证主义引入经济学的哈奇森就承认:“自本(20)世纪30年代以来,经济学家们逐渐认识到在经济学和社会科学领域中很少有,并且经证明也的确没有什么论述应该被庄严地赋予‘定律’这一称谓”。同样,基于归纳的简单证伪更不意味着就能证伪理论。例如,波兰尼就指出,“只要有一个反面的证据就可以反驳一条普遍法则,这是正确的,但是经验只能给我们提供一些显而易见的反常,没有什么精确的规则能告诉我们那些显而易见的反常是否就是事实上的反例。因此,科学陈述的证伪和它的确证一样都不能严格地建立。确证和证伪在程序的形式上都是不确定的。”

同时,如果说波兰尼的论断适合所有的科学研究的话,那么,它对将包含经济学在内的社会科学将会更加适合。究其原因,(1)经济现象要比一般的自然现象更为复杂,而经济统计数字本身就很少能与经济理论中产生的概念完全吻合;(2)任何经济理论模型都包含着诸多子条件的假设,而这些假设本身往往就是不现实的。麦克洛斯基就指出,“任何一个假说的检验里,辅助性假设都是必不可少的,由于它们的存在,任何检验都不是决定性的。这不仅仅是多数科学分歧的潜在内含,而且是他们的本质所在,例如:‘你的实验没有控制好’;‘你没有解决识别问题’;‘你采用了均衡(竞争、单方程)模型,非均衡(垄断、500个联立方程)模型才合乎实际情况。’而且,即使某个待验假说可以被孤立出来,假说的概然性质可以使任何决定性检验变成非决定性的”。

第二部分  计量文章的现实面貌

国内一些所谓的“主流”经济学人如此渲染计量实证分析的价值,那么,我们就来看看当前那些计量实证文章究竟在研究什么?是如何研究的?得出了什么“洞识”?

一、无关经济理论的研究议题

计量经济学本身是基于对经济理论进行严密化这一目的而产生的,计量实证本身是理论探究的一个重要过程,它注重的是对事物内在因果关系的揭示;而计量经济学要实现它的原初宗旨,就需要将计量分析工具和经济理论有机契合起来,要运用人的知性思维对计量结果进行系统分析,并将之与现有理论进行系统的比较分析,这包括假设前提、影响因素以及数据处理等各方面。在很大程度上,我们不能简单地因为一次或少量的实验结果就“证伪”原有理论,除非我们能够建立起一套逻辑严密的解释体系;同时,我们不能简单地以计量结果来预测未来事件或者指导实践,除非我们对计量的假设前提与现实的各种因素作了仔细辨识。在很大程度上,只有揭示出事物之间作用的因果机理,我们才可以获得认知的增进和理论的提升,才能为人们所接受。

举两个例子说明。例1.1847年I.Semmelweiss发现,如果医生在为待产孕妇接生前将手洗干净就会大幅减少产妇的死亡人数,但当他将这一发现告诉医学同行并劝他们改变行为方式时,得到的却是嘲讽,甚至自己也被逼疯而以自杀了结一生。究其原因,Semmelweiss还没有发现洗干净受减少孕妇死亡的因果机理,也就没有建立起一套真正的理论。事实上,直到后来L.Pasteur和J.Lister完成了细菌理论,对卫生为何至关重要作出了因果机理的解释,医生们才认为手术前洗干净手是必要的。例2.半个多世纪以前,有人就写信给英国的《自然》杂志声称,不同动物的平均怀孕期(从兔子到母牛)都是π的整数倍;而且证据是大量的,统计一致性也很好。但时至今日,科学界始终不理睬这一观点,因为找不出任何理由来说明两者之间的关系。

事实上,亨利.庞加莱曾写道:“科学是由事实逐步建立的,正如房子是由石头渐渐垒砌的一样;但是,一堆事实并不是科学,正如一堆石头不是房子一样。”在很大程度上,单纯的计量实证至多能够提供有关“是什么”的事实,却无法揭示“为什么如此”的原因,从而也就无法直接由现象导向理论;正因如此,计量分析必须与经济理论结合起来,只有具有深厚的经济理论功底才能从计量实证中挖掘出因果机理并将之上升为理论。相反,如果缺乏足够的经济理论指导而简单地依靠计量分析,就不仅无法揭示作用机制,反而常常得出一系列荒谬的论断。

(一)计量经济学的应用退化

尽管计量经济学的诞生之初是为了证实进而严密化经济理论,但它的现实应用却远远地背离了这一初心。事实上,当前绝大多数从事统计分析或计量实证的经济学人都是出身于数学、统计学或物理学等领域,他们往往缺乏足够的经济理论知识以及其他人文社会科学素养;这样,他们往往仅凭一些非常片面而狭隘的数据处理就得出结论,从而经常出现“瞎子摸象”和“见树不见林”的闹剧。

这里可以举几个例子。例如,传统的观点认为,饭后不要马上就躺下不动,所谓“饭后百步走,活到九十九”;但是,目前一些学者凭借其狭隘数据的实证研究却提出了相反的观点,“要活九十九,饭后不要走”。再如,传统观点认为,必要的性生活对维持一个人的身心健康是必要的,它有助于舒缓人的精神压力并进而活跃人的思维;但是,最近的一些实证研究却提出了相反的观点:性生活会钝化人的智力。所有这些结论似乎都有数据的支撑,从而符合现代经济学强调的客观性要求;但是,所有这些结论却没有能够揭示机理,没有解释“为什么会如此”。

读者不要急于反驳说,这些似乎根本与经济学研究无关:不仅它们所研究的东西不属于经济学的研究领域,而且分析的结论也与经济学理论似乎没有任何关系。但是,确实有相当一部分经济学家就在做这种不是经济学的研究,因为现代经济学人已经将盛行于经济学界的计量方法和实证分析推广到绝大多数领域,而不管这个领域是否属于传统经济学的。笔者在英国访问时参加了系列seminar,其中一位主讲者的题目就是“人的胖瘦与学术成就的关系”,他在计量的基础上得出“研究”结论:肥胖会妨碍学术成就。

一个更为荒谬的研究文章是英国华威大学的青年经济学人巴克斯所作的,他自我感觉长相不差,但在30岁之前却有3年找不到女友,因而写出了一篇《为什么我没有女友:应用德雷克公式在英国找寻爱侣》的论文而宣言,在茫茫人海寻觅真爱人的几率仅比在浩瀚星海中寻外星人容易一点。其做法是:把1961年发明的德雷克外星文明数量公式(Drake Equation)中符合外星文明条件的变量转为自己的择偶条件,先考虑全英女性人口,再以“伦敦女性人数”、“适合年龄层(即24至34岁)”、“有大学学位”以及“外型具吸引力”等因素逐步缩窄范围;运算结果发现,全英300万女性中仅26人可能成为他的理想女友,而一晚外出可以结识到这些女子的机会仅为0.0000034%。并且还努力进行实证分析。显然,这种研究在思维上就是荒谬的,因为人类的真爱本身是社会性,需要互动和相互付出才可以得到,而不是符合某些客观条件。事实上,如果按照经济学的这种思维,真爱反而很容易获得,因为只要将个人偏好输入互联网进行匹对就行了。

事实上,纵观当前的计量经济学文章,绝大多数都呈现出这样的特点:(1)要么是无关经济理论的,所“研究”问题的根本不处于传统经济学领域,或者研究者根本不具有该领域的基本知识;(2)要么是反经济理论的,其结论与经济学理论明显相悖,却根本没有解释。究其原因,在实证拜物教以及求新求异学风的支配下,现代经济学对实证研究的推崇已经到了匪夷所思的程度:经济学家可以与任何学科进行联合研究,却不需要相关方面的基本知识。例如,目前经济学界就有很多文章探讨教育的收益、教育对经济增长的作用以及最优教育水平的选择等问题,但是,这种“研究者”却对教育在人类社会中的角色几乎一无所知,不了解公共教育与私人教育间的差异,不了解自然科学教育与人文社会科学教育间的差异,不了解教育收益的社会外部性,甚至也不了解教育对个体偏好的影响。

(二)见树不见林的计量文章

当前,越来越多的经济学人热衷于运用计量分析对一些新领域进行分析,并由此往往会得出一些新的结论,却不去探索其内在的作用机理。

例如,最近突然冒出了很多研究方言与经济增长的文章,其基本结论是,方言的存在严重制约了经济增长。既然如此,为何联合国以及各国都在努力保护方言和地方文化呢?如果像作者所说,他的研究仅仅关注效率问题,那又如何解释西方拉丁世界的资本主义崛起正发生在各地方言兴起并取代原来统一的拉丁文之时的?本质上说,多元化可以防止无法预见的冲击:如果一方因某种冲击而泯灭,另一方则还能够生存下来。就人类历史来看,正是由于多元文化的存在,欧洲成为各种思潮和制度的孵化和实验场所,形成了各种各样的制度模式:君主制、君主立宪、共和制相互竞争,迄今依旧实行不同的制度模式。

再如,目前也兴起了一股法律与经济发展的实证分析浪潮,一些学者就采用公检法的费用支出来代表法律活动,并由此得到法律活动与经济增长正相关的结论。但天哪,一个有序的经济运行机制不正应体现为较低的法律实际活动吗?难道法律活动的下降不是社会发展的应有趋势吗?而这些研究却在鼓吹更多的法律活动。

不幸的是,在现代经济学的学术取向下,越来越多的经济学人却转向了这方面的研究,并发表了一篇篇“前沿”论文。而且,就是基于这种形式主义的研究,却要为国家发展提供政策建议,并获得国家大量的经费资助,这岂不可笑和荒唐!

即使在传统的经济学领域,基于计量实证的肤浅性和荒唐性也展现得淋漓尽致。例如,过去二、三十年里发展经济学家十分钟爱的“跨国增长回归”的统计学方法就主要依赖于数据集的精心搜集整理,这些数据只要能够描述大量国家多年的GDP、政治体制、教育程度以及其它变量,然后将这些数据输入计算机,然后观察一国经济中有哪些特征与经济增长相关。显然,这种研究策略可以并已经得出了太多的答案了。2002年,发展经济学家Romain Wacziarg用尖刻的笔调写道:“那些宣称可以促进人均收入增长的灵丹妙药中,包括高有形资本投资率……低生育率、距赤道远、低热带病发病率、临海……和条件适当的外国援助。”我已经省略了瓦奇亚克列出的17项“灵丹妙药”,他还指出,这个名单“正变得越来越长,永远列不完”。而且,利用这种跨国增长回归而证明的大量统计学关系中有不少是相互矛盾的:如有的证明外国援助能够促进增长,有的则说不能促进增长,还有的论证可以在特定条件下促进增长。

更具嘲讽意味的是,赫尔辛基大学的博士生Westling的论文《男性器官与经济增长:尺寸有关系?》利用“跨国增长回归”方法并在其中加入一些相当反常规的数据后却发现,一个国家的国民收入与该国男子阴茎的平均勃起长度有关。确切的说,有这样几点结论:(1)1985年阴茎勃起尺寸居中国家的国民收入水平最高;(2)1960至1985年间阴茎勃起尺寸则与经济增长呈反比关系;(3)13.5厘米的勃起阴茎长度则是“能够使GDP最大化的尺寸。”而且,Westling强调,他采用的是标准的统计方法,结果具有鲁棒性;这种相关性无论在统计学上还是经济学上都具有重大意义——换言之,这项统计结果大到不容忽视的地步,不会只是巧合而已。当有学者问Westling如何看待自己的研究论文,他提出了“嘲讽经济学”这个术语,并补充道:“从科学角度讲,这篇论文很可能和当代经济学大多数论文一样毫无价值可言。”

不幸的是,尽管统计结果在很大程度上站不住脚甚至是荒唐可笑的,将统计学关系转变为一项可行的政策就是非常困难,但现代主流经济学人却往往要基于其实证研究而提出政策建言。举目前(2010年)在西方社会正日益勃兴的气候和环境经济学为例:经济学家对人类经济活动如何影响大气和环境的作用机制知之甚少,要简单地通过数据的处理来对相关问题指手画脚。譬如,2009年下半年哥本哈根全球气候会议之际,我在英国Exeter大学参加一个Simenar就涉及这类主题,主讲者的大致结论是,计量数据表明,GDP的增长以及二氧化碳的排放与全球温度上升并没有正相关性,因此,长期被认定为“二氧化氮排放量增加会引起‘温室效应’”的结论是不成立的,全球气候会议制定的二氧化碳减排方向根本是“庸人自扰”。确实,迄今为止所使用的气候模型大多未能预测近年来的温度骤增情况,这在很大程度上反映出,这些模型本身就是有问题的,更不要说,目前有关二氧化碳排放量的数据本身也存在问题。

不过,即使研究所选取的数据没有问题,目前也没有二氧化碳排放与温度上升间正向关系的研究发现,这也不能得出不应减排的主张。(1)影响气温变化的因素除温室气体之外还有其他诸多因素,如浮尘对阳光的遮挡、城市化产生的“热岛”、海洋对热量的吸收而导致大气变暖的滞后,以及地球本身也许正处于“寒冬”周期,等等;(2)即使二氧化碳排放导致的气温上升可以为其他因素的变化而抵消,也不能得出二氧化碳减排无足轻重的结论,因为二氧化碳排放为人类也会带来其他危害,这包括环境污染导致的基因变异、疾病爆发,甚至直接影响人们日常生活和工作的心情,等等。此外,即使气温变暖是一个确切的事实,我们也无法由简单的计量模型来证实高温是由气体排放造成的温室效应所引起的,相反,在很大程度上只能依靠逻辑机理的分析以及其他经验的推测。(1)物理学的基本理论已表明,二氧化碳分子能够吸收红外线辐射,从而使得温度变高,这也很容易在实验室中得到检测;(2)天文学的观察也表明,有高密度温室气体的金星的地表温度达到了水的沸点的多倍,而缺乏温室气体的火星的地表温度非常低以致水无法以液态形式存在。

总之,尽管作为处理经济数据以剖析经济现象之间关系的一门日益精确工具,经济学研究中运用实证方法和计量工具是无可厚非的:(1)它可以使得纷繁芜杂的社会关系变得清晰,从而可以更清晰地对现象进行描述和刻画;(2)它借助数学逻辑而有助于认知的严密化和精确化,从而有益于思想的发现和传播。但是,我们必须清晰,计量结论仅仅告诉了我们一些事实,而这些事实并不能展示现象背后的本质和因果机理。哈耶克很早就写道:“大多数经济学家在今天仍然热衷于使用的那些统计测量数字,或许从历史事实的角度来看是颇具意义的;但是,对于从理论上解释那些自我维续的模式来说,这种量的资料却是没有多大意义的;正如我们所知,当人体生物学所侧重解释的恰恰是那些碰巧被拿到解剖室里的不同人的人体器官(不如说胃和肝)的不同的尺寸和现状的时候,上述那种量的数据对于这种人体生物学也是没有多大意义的。”事实上,事物的本质以及事物之间的因果机理本身就是超经验的东西,因此,要深化对社会事物的本体论认知,促进社会经济理论的发展,根本上需要依靠研究者的智性思维。同时,不同学者对同一“事实”的解读往往也是不一样的,从而就产生了不同的学说观点,并发展出不同的流派;而对数据解读的合理程度往往与学者的知识结构和理论素养有关:一个学者的知识结构越广、理论素养越深,那么,他就越容易通过现象挖掘本质,其得出的结论也就越真实。

不幸的是,随着现代主流经济学的教育越来越偏重于数学技能而越来越忽视基本的思维训练,现代经济学的实证分析者也越来越缺乏足够的经济理论素养;相应地,他们就无法正确合理地使用计量分析工具,甚至往往误读了计量结论。所以,诺思写道:“在整个人类历史上,我们误解现实的概率远比正确理解现实的概率大得多,因而认识现实的本质就很重要。”尤其是,在计量分析缺陷如此明显的情况下,当前很多从事计量实证的学人却关注如何应用这些计量工具而毫不关心应用的实际效果;相反,为了促使人相信他们的研究成果、从而能够使论文得益发表,他们还极力宣扬其研究方法的科学性和研究结论的客观性,从而使得当前这种研究具有极强的“伪科学”性。实际上,维多利亚女王最为宠爱的首相迪斯累利就指出,有三种谎言:谎言、该诅咒的谎言和统计资料。就当前而言,统计资料改为计量分析更为恰当,因为以前的统计资料固然存在很多的不足,但它的应用还是受到很大限制,统计学家在使用统计分析时还存在很大的敬畏心;但是,自从计量分析得到发展并大肆应用到经济分析中之后,它就失去了使用领域的限制,反而被鼓吹为最为科学的方法。其实,大逻辑学家奎因就指出,科学本身是常识的继续,而科学家和普通人在迹象辨识力上的没有区别,除非科学家更仔细。但是,目前那些大量形式优美却没有经济理论内涵的计量结论往往很难经得起思辨逻辑的耙疏,甚至很多结论本身就是缺乏基本常识的,不可思议的是,它们却往往被当做“创新”和“洞见”而传播。正因如此,我们对这些“洞见”应该持有最大限度的审慎。

二、追求庸俗范式的研究动机

一般来说,计量工具的发展是经济学研究日益实用化的推进剂,泛滥的实证分析也是经济学实用化取向的明显表征。显然,要防止经济学研究的庸俗化,就需要对实证分析本身的特点及其要求进行审视。

事实上,如果对逻辑实证主义的内在逻辑作深刻的剖析,就可以发现逻辑实证主义在解释、确证和理论构建上都存在严重的逻辑缺陷;由此,我们可以对实证经济学在解释上的合理性、预测上的可信性以及指导实践上的有用性进行批判,进而发现实证分析内含的“致命自负”。当然,计量只不过是处理经济数据以分析经济现象之间关系的一个手段和工具,因而应用于经济研究本身是无可厚非的,这里也不存在价值判断;同样,数理模型也是有益于思想严密化、精确化的一个手段和工具,并有益于思想的发现和传播。问题是,尽管手段和工具本身无所谓对错,但使用者却往往出于不同目的,这样,同一分析手段或工具往往就会得出不截然不同的结论,进而对理论发展也会产生截然不同的影响。因此,如果基于不纯的目的来使用计量工具,那么,就可能使得这些工具遭到滥用,并进而庸俗化实证分析。

(一)理解实证分析的适用限度

这里作两点说明。

第一,理论探索并非不要进行实证研究,但确实不应过分强调实证的理论意义。

事实上,正如J.内维尔.凯恩斯指出的,“如果清楚地认识到统计的局限,如果它们是在足够广的范围内准确地收集,如果它们的运用是不带偏见而全部的调查深入到其真实的意义中,并且如果它们是完全和合适地进行收集和分类,那么,它们的价值是独一无二的。”而且,在揭示了事物的本质以及考察了事物的现状以后,就必须对现状何以偏离本质的原因进行探讨,需要对影响因素进行实证分析,同时也必须对纠偏的措施及方案进行实证考察。例如,韦伯就强调,“绝不是由于价值判断归根到底立足于某些理想,从而具有‘主观的’起源,就可以摆脱科学的讨论……问题毋宁说是:对理想和价值判断所做的科学批判的意义和目的是什么?对此需要做更为深入的考察。”在他看来,对有意义的人类行为的终极要素所做的任何有思想的探索,都首先与目的和手段这两个范畴密切相关。

显然,手段和目的两方面都可以进行科学的考察。(1)手段对于给定目的的适当性问题是绝对可以进行科学考察的,这包括哪些手段适合于引向一个前定的目的,哪些手段不适合于引向一个前定的目的,或者权衡可利用的手段达到某个目的的可能性,从而判断目的设定自身在实践上的意义,这些方面都需要充分使用数理逻辑和计量分析的方法。(2)当达到一个前定目的的可能性看来已经存在的时候,还需要进一步确定运用必要的手段可能产生的除希望达到的目的之外的其他可能后果,因为所有事件都是普遍联系的;这样,研究者就可以进一步考虑:就预料中将会出现的对其他价值的损害而言,达到希望目的的“代价”是什么?显然,对一个有社会责任心的学者而言,他不能忽视对行为的目的和后果作出权衡,这是哈耶克所强调的社会科学家应该具有的知识和素质,而这些方面是无法通过数理推理和计量实证而获得的。

第二,实证研究强调“是什么”也并非就没有思想,但确实要提防当前的庸俗化现象。

事实上,经验数据的统计不仅可以检验核修正理论的假设前提,还可以对理论本身进行检验和发展;因此,笔者坚持认为,实证的前提和方法中都充满了思想,从来就没有纯粹的实证分析。这就如历史学家考证历史事件就充满了思想,否则就成了图书资料整理员了。历史哲学家克罗齐就强调,史实只有通过史学家本人心灵或思想的冶炼才能成为史学,而离开思想只能是史料编撰者而不是史学家。同样,没有思想的实证在经济学中就只能仅仅作为统计员而存在,他无权发表意见,惟一的职责就是为他人推理和建立理论收集证据。萨缪尔森就嘲讽说,“给魏德纳图书馆的猴子一个包罗万象的数据库,你不会得到一个经济史专家。你得到的是一个数据库和一个图书馆馆长。”所以,我们在应用数学、计量乃至各种软件等工具作实证分析时,首先必须通晓相关的知识,必须有相应的理论为指导或者事先有一个合理的研究思路,否则,肯定是无意义的。

当然,找两个数据借助于计量经济学测算一下相关性,这并不是真正的实证分析;相反,真正有价值的计量涉及非常广的知识,否则这种实证的结果和建议必然会引起强烈的谴责。也就是说,要进行真正的实证分析是非常困难的。(1)必须对统计数据进行考订,这包括数据的筛选、填补:如信息太多,变量怎样选择,个案如何处理;而如信息太少,数据如何变更和添加。(2)还必须对数据产生的相关背景进行分析,这包括战争、灾荒、国内政策、世界市场等,否则,仅仅在数据上作文章是得不出任何有意义的结论的。事实上,曾经一段时间作过的经济史研究使笔者深深地认识到,每一次的数据统计都是一个异常艰难的工作。例如,新中国成立之前各时期中,统计最为完好的经济资料是1933年的国民生产所得,但即使如此,不同的版本相差也非常大。特别需要指出的是,计量本来就是一项“吃力不讨好”的工作:(1)如果证实了某规律,其贡献也归该规律提出者所有;(2)如果证伪某理论了,却没有提出相对应的新理论,也引不起其他学者的兴趣。更为艰难的是,在国外学术界,只要计量过程中出现一点纰漏,譬如,数据的选取、方法的采用等,那么,所有的工作就会被根本否定掉。

(二)实证分析庸俗化的主要表现

尽管审慎的实证分析非常有意义,也有非常严格的要求;但是,目前中国社会流行的实证分析倾向却忽视了这些基本要求,以致往往徒有其形而无其实。在某种意义上说,中国学者之所以热衷于实证分析,往往只是将之作为发表文章以获得各种私利的手段,从而存在明显的庸俗化表征。关于这一点,我们也可以从如下三方面加以剖析。

第一,体现在实证比较的逻辑及相应的解释

事实上,要依赖实证分析的结果来对经济现象加以解释,需要非常严格的逻辑关系,而目前的实证文章恰恰是逻辑不严密的。譬如,在2008年北京举办奥运会以及2010年广州举办亚运会之际,一些从事计量分析的人就敏锐地发现了这一获取课题的寻租机会:通过各种统计数据之间的计量分析来解释、预测奥运会对全国经济发展、以及亚运会对广州经济发展的影响,并以此申请了新的课题。当然,为了迎合主旋律,这些研究一般都是在论证奥运会或亚运会的举办对一些重要产业的发展乃至整体GDP的增长有正面效果;而且,在中国经济处于高速发展的当前时期,基于数字之间简单联系所得出的研究结果确实能够给出两者之间的正相关性。但试问:这种实证分析有任何意义吗?对社会发展又起到了怎样的作用呢?其实,只要对这种分析逻辑作一最初步的深究,其内在的牵强附会或空洞无物就是显而易见的了。

穆勒曾提出比较研究应该遵循的差异原则:在抽出其他社会因素而保证只存在是否举办奥运会或亚运会这一种情况不同的条件下,对举办前后的经济发展情形进行比较。根据这一原则,在通过实证来获取一般性的研究结论时,我们就应该反思:由于奥运会或亚运会举办前后的社会环境存在明显的差异,即使经济发展速度在继续发展或者更快发展,这就能够说明是举办奥运会或亚运会所推动的吗?一般地,如果发展速度下降了,这并不能说是奥运会或亚运会的举办抑制了经济增长,因为如果没有举办也许发展速度下降更快;同样,如果发展速度上升了,这也不能说是奥运会或亚运会的举办推动了经济增长,因为这也许本身是其他社会环境改变的结果。况且,如果把因举办奥运会、亚运会而投入的资金用于其他方面的建设,也许可以获得更高的经济增长率。但是,流行的计量分析往往都没有作这方面的比较,就得出了大型运动会举办推动经济增长的结论,不亦太荒谬了点吗?否则,我们年年举办大型运动会岂非最佳政策选择?

第二,体现在数据的搜集方式及对待数据的态度上

事实上,大量的实证分析基本上都是建立在各级政府或部门发布的统计数据之上,但当前公布的GDP数字的真实性往往是值得怀疑的,媒体上不是经常报道统计数据打架的情况吗?一般认为,这主要有如下几方面的原因:(1)基于政绩观的数字虚高。中国官员是对上级负责,而上级考核的一个重要指标就是GDP,在这种政绩观下,地方官员往往会把中央政府工作报告中设定的预期目标作为基准,或者一次作为各地加权的平均数的话,而力图使本地的增长率高于平均数,甚至为追求政绩而不择手段。(2)统计上报中的人为造假。在以GDP为考核指标的末位淘汰体系支配下,各地方统计部门报送数字时也往往左顾右盼,在实际数字中有要向上进行浮动调整;结果,导致了地、市加起来的比省大,各省加起来的比国家大,从而在统计上报的过程中出现人为的虚增。(3)统计口径选择的不一致。目前的地方政府为了凸显其政绩,在统计GDP总量和人均GDP时往往采取不一致的口径:在统计GDP是将户籍与非户籍人口所创造的经济成果一并计算在内,而在计算人均GDP时却仅仅以户籍人口为基数。(4)统计基数估算的不真实。即使以常住人口为人均GDP的统一计算口径,但常住人口的估量本身也往往存在问题,因为往往无法将常住人口和短期的外来打工者分开。(5)按常住人口统计也存在不合理。影响世界各国人均GDP的一个重要因素是非就业人口所占的比例,但沿海地区的外来常住人口基本都是青壮年,几乎都是创造GDP的劳动力,而没有考虑到那些没有和他们一起来但生活密切相关的老人和小孩。(6)统计过程中的交叉重复。除了上述人为的因素,中国社会的GDP总量统计过程本身就存在系统的误差,因为中国各地区经济本来就是一个整体,但GDP的统计却是分别统计再相加的;因此,在加总的过程中,就不可避免会重复计算,特别是,在政绩观的指引下往往是多报的。

正因为中国GDP数字因地方官员的政绩观考虑而在统计层面上存在人为调高的现象,国外很经济学家都认为中国的GDP增长速度不是真实的。例如,匹兹堡大学的饶斯基(Thomas Rawski)就认为中国的经济增长是假的。按他的研究,中国20世纪末的发展速度顶多是3%,很可能是接近零增长。但是,如果考虑到大量存在的遗漏而未统计的灰色经济,中国社会的经济发展又可能远比饶斯基估计的要快。事实上,毕竟中国法制漏洞太多了,以致很多收入都没有公开,也很难被统计。无论如何,当前的GDP统计数据是有问题的。有基层统计人员甚至指出,GDP的统计全是上级领导告诉我们今年GDP 要增长多少,统计人员就出来地区GDP 的值是多少。试想,这种的数字可信吗?在应用数据进行分析和预测时是否要先考证一下这些统计和公布的数字的真实性呢?如果只看数据而不知细节,并且拿一个不准确的数据放进计算机,通过回归统计就获得算出“因果”关系,或者由此对理论进行实证检验,或者由此来对社会经济现象进行预测,甚至以此指导社会的发展,不亦太荒唐了吗?弗里德曼很早就痛下批评:把废物放进计算机,算出来的当然也是废物。正因如此,一个严谨的学者在面对这些数字时,首先要对这些数据进行甄别;从某种意义上讲,对统计数据的考证本身也就是当前学术界的一项重要任务。显然,如果没有数据考证这个前提工作,那么,中国社会经济状况就根本无法做到定量分析,而至多只能作定性的探究,而那些所谓的定量分析都只是自欺欺人的把戏。问题是,如此多的中国学人在GDP数据上进行实证分析,但有多少对这些数据进行了认真的考订了呢?

第三,体现在研究者的学问目的和学术态度上

事实上,当前绝大多数热衷于实证分析的学者似乎都不在乎数据的准确性,而仅仅关心是否可以获得数据;而且,即使存在明显的多种数据来源,绝大多数人也没有能力对数据进行甄别、考证,从而很少有人对各种数据进行比较和梳理。特别是,由于绝大多数学人都是按照数据的可得性而不是真实的相关性程度来进行变量的取舍,以致他们可以把GDP数据与任何可想象的事物联系起来,通过功能性的数据处理来“计量”分析影响经济发展的因素,从而可以围绕GDP数字上作任何可以想象的文章。显然,这样的学者作如此的文章在当前经济学界实在太普遍了,他们很少关注计量分析本身所存在的缺陷,不认真辨析因变量和自变量间的关系;特别是,经济学理论基础越差的人似乎越倾向于搞“高级”的计量实证,这也是目前计量分析文章大多是在读研究生所撰写的原因。根本上,计量经济学本身需要经济学、统计学以及数学等多方面的知识,有鉴于此,萨缪尔森几乎一辈子不太敢用统计方法分析经济问题的潮流,仅有的一篇有回归分析的有关消费函数的数据文章还是错误的。但是,在当前中国社会,似乎人人都热衷于搞所谓的“计量分析”,而且,只要掌握几个计量工具谁都可以搞实证分析,岂不太胆大妄为了!

当前经济学界之所以形成这种“计量盛况”,根本原因就在于,他们很少关心是否可以从研究中获得认知,而主要是为了满足他人的要求以期获得金钱的收益。正因如此,如果有人对他的学术来源提出质疑,他就会搪塞说,这是某某年鉴或协会公布的,如果存在错误,那么你也应该去问他们;同样,如果有人对他们所采用的计量工具或模型提出质疑,他就会说,这是主流的分析模型或者西方某某人或某某文章中就采用了这一工具或模型,如果存在错误,那么你也应该去问他们。呜呼,一个自己投入大量时间和精力并且试图以换取报酬的研究,却连从研究中获得认知这一基本想法都没有:不但不首先确定先前设定目的的合理性,不探讨事物之间的内在联系;而且,也不对这些数据的真实性和工具的合理性等基本问题进行反思,更不认真分析采用的手段可能带来的坏的后果。相反,在仅仅学了几个经济学概念之后就开始照搬一些模型和定理搞所谓的实证研究,把一切内在的问题都推给别人,却还要由此提出政策主张和建议,那么,这些政策主张和建议还可信吗?而且,这是学者应有的学术态度和学问精神吗?不可思议的是,这些人却往往能够赢得高额的物质回报和巨大的学术声誉,特别是,竟然可以源源不断地承接各种旨在解决具体问题的应用性课题!

总之,尽管实证分析为理论的检验确实提供了一个重要工具,但理论发展根本上不是实证分析推动的,相反,实证分析带来的经济研究中的实用主义倾向往往妨碍了思维的扩展。关于这一点,默顿很早就曾提出告诫:“科学家在评价科学工作时,除了着眼于它的应用目的外,更重视对扩大知识自身的价值。只有立足于这一点,科学制度才能有相当的自主性,科学家也才能自主地研究它们认为重要性的东西,而不是受他人的支配。相反,如果实际应用性成为重要性的惟一尺度,那么科学只会成为工业的或神学的或政治的奴仆,其自由性就丧失了。这就是为什么今天的许多科学家对三个世纪前由弗郎西斯.培根所提出的观点表示担忧的原因,培根由于提出科学具有实用性价值,因而使科学具有了社会价值。”特别是,在伦理自然主义思维的支配下,流行的实证主义往往肯定性特征,从而强化了主流学术和现实制度。显然,这与学者发现问题、揭示缺陷这一特质是相冲突的。科塞就强调,“知识分子是从不满足于事物的现状,从不满足于求助陈规陋习的人。他们以更高层次的普遍真理,对当前的真理提出质问,针对注重实际的要求,他们以‘不实际的应然’相抗衡。”不幸的是,目前中国社会的海归学人急急乎热衷于被视为“致用”的实证研究,并以此来维护与中国社会已经严重脱节的现代西方主流经济学说,甚至为现实社会中出现的大量丑陋现象进行辩护;显然,这种实证分析已经被庸俗化了,从而背离了实证分析提出之初的宗旨,并为经济学发展带来了适得其反的后果。

三、高度主观任性的研究过程

现代主流经济学之所以推崇计量实证分析,一个重要理由就是,实证是以数据说话,从而具有客观性。问题是,尽管主流经济学往往强调实经济学的科学性、客观性,但实证分析果真是客观的吗?一般地,针对现代主流经济学视为客观并机理推崇的实证分析,我们可以作如下审视。

首先,现代主流经济学认为,实证分析是以数据说话,基于数据分析的结论是客观的。

问题在于,数据本身是死的,而一旦经过人的嘴说出来和经过人的笔写出来,就带上观察主体的理解,从而就呈现出明显的主观性。主观性在当下流行的计量分析中体现得尤其严重。Hoover等写道:“所有经济学家都同意:现实是复杂的,而我们处理它所使用的工具则要简单得多。经济学家有时处理这一沟堑时会求助非常少量的数据,这样,从‘程式化的’的事实开始儿发展出了相对简单的理论来加以解释。不幸的是,程式化的事实往往因为太程式化了而无法在那些似是而非的候选理论中进行区别,或者为更精确的量化提供基准。为此,一个替代的分析方法就是,从另一头开始,为(理论)寻找大量的数据。”正因如此,目前流行的计量实证研究往往是在给定一个理论框架下,寻找一些理论来证实或证伪它,因而在数据的选择、处理和解释中就可以让研究者自由地发挥,从而就潜藏了明显的主观性。

其次,现代主流经济学强调,经济学根本上要作描述“是什么”的纯粹实证分析。

问题在于,纯粹的实证根本没有任何意义,而任何基于政策目的实证都打上了深深的意识形态。例如,作为微观经济学理论核心的一般均衡理论,就是与西方政治哲学所确立的众多策略中最吸引人的部分——社会契约相适应;正如,罗森伯格所说,主流经济学家之所以热衷于一般均衡理论,也就是“因为他们已经相信它已经把市场作为一种社会体制加以接受的最佳契约论理论的一部分”,而“不是因为他们相信一般均衡理论在关于解决活动的描述性和预见性精确说明方面会有所提高”。正因如此,罗宾逊夫人和伊特韦尔在1973年出版的《现代经济学导论》中就写道:“经济学包括三个方面或者起着三种作用:极力要理解经济是如何运转的;提出改进的建议并证明衡量改革的标准是正当的;判断什么是可取的,这个标准必定涉及到的和政治判断。经济学绝不可能是一门完全‘纯粹’的科学,而不掺杂人的价值标准。对经济问题进行观察的道德和政治观点,往往同所提出的问题甚至同所使用的分析方法那么不可分割地纠缠在一起,因而上述政治经济学的三要素,就不那么容易保持他们之间的分明界限了。”罗宾逊夫人在1977年的《问题是什么》一文中又指出,主流经济学在很大程度上受意识形态的错误驱使。

事实上,即使作为主流经济学家的索洛,他也承认经济学理论中的价值因素。索洛说:“社会科学家和其他人一样,具有阶级利益、意识形态信念和各种各样的价值观。但是,所有的社会科学研究不同于研究材料强度或血色素分子结构,它们和意识形态、利益与价值的关系特别接近。不管社会科学家是否接受和是否知道这些,甚至是否和它们作过斗争,但它对研究领域的选择、提出的问题、不愿提出的问题、他的研究框架、他的用此法时,都很可能在某种程度上反映他的利益、意识形态和价值观”。

在实际应用中,无论是计量模型的建立过程还是研究者借此说明的问题都潜含了深深的主观性和规范性,基于现代主流经济学框架的实证分析尤其如此,这里从如下几方面加以说明。

(一)主流经济框架内含一元化的意识形态

我们知道,流行的实证分析基本都是在主流的新古典-凯恩斯经济学框架下展开的,而这种主流经济学则根基于特定的价值观和分析思维,实证分析则主要是在特定的引导假定下为主流经济学理论提供细枝末节的佐证。正因如此,根本就没有所谓的纯粹实证分析,在西方主流经济学占据支配地位情况下,目前那些实证分析也往往浸含着西方主流社会的意识形态。马兰沃写道,“正像整个科学家共同体所认为的那样,评价经济学这门学科的依据是目前学科前沿领域中的研究状况,这些依据应当是不证自明的”。事实上,尽管现代主流经济学强调价值无涉,但并不意味着它不存在意识形态的考虑,而仅仅是要求对它所崇尚的主流社会的价值观“存而不争”。它要求撇开意识形态不作争论,实质上是要求不能对原子主义的物质利益最大化原理提出质疑,这是典型的一元化意识形态。一般来说,任何社会强调不要对诸如意识形态等问题进行争论而呼吁从事所谓的实证研究都是为了加强主流的意识形态,都是为了维护现状,从而也是为了强化强势者或既得利益集团的利益。譬如,主流经济学就是在伦理实证主义价值观的支配下从事实证研究,从而将供求决定的存在是为合理的,但显然,纯粹供求决定的结果必然体现强势者的利益,有助于既得利益集团的利益分配。

其实,任何社会科学的理论研究都必须事先存在一个基本目的,也就潜含了特定的价值判断,从而也必然是规范性的。譬如,新古典经济学就试图在“每个人都是理性”的这一引导假定下并借助博弈理论等来论证现存制度的合理性,并进而维护西方社会信奉的个体主义行为模式。同时,正是基于存在即合理的价值观,在面对市场失灵和政府失灵时,现代主流经济学往往想当然地以为市场失灵的危害是较轻的,并且是可以得到缓解的;相反,政府失灵带来的灾祸远较市场失灵严重,并且,还具有恶性发展的倾向而不能得到缓解。面对这种庸俗化的经济学,不但以马克思为代表的社会主义学派对早期资本主义社会制度的本质作了深入地挖掘,对古典经济学中的庸俗化取向作了深刻的批判;而且,以凡勃伦为代表的早期制度著者以及以马尔库塞为代表的激进学者也对现代资本主义的特征作了充分的揭示,对新古典经济学中的辩护性作了强烈的鞭挞。

(二)实证分析的数据选择具有主观性

计量分析的可信性关键在于数据的可靠性和代表性,为此,每个研究者心中都有一幅他所要得到的并能解决其问题的证据的图景,也即需要一个理想的资料集。一般来说,理想的资料集是,可以得到足够且刚好足够的能使我们回答所面临的问题的信息。但不幸的是,对大多数问题来说,我们能够收集到的真实资料往往并不符合这一理想需要:社会现有的资料或者太多了或者太少了。这样,(1)当社会给予的资料太多时,就必须对材料进行合理选择;不过,研究者往往为了论证心中早有定数的观点而去刻意地寻找一些相关的数据,即使存在一些明显相互冲突的相关数据也会置那些不利证据于不顾。(2)当社会给予的资料太少时,人们往往或者使用不足的数据分析,或者使用一些替代材料;显然,如何使用往往取决于研究者的想象和才智,也取决于研究者对待研究和学术的态度。正因为一切数据都是从现实中挑选出来的,而这种选择则是以某一时代的世界观或理论模式为基础的,从而要受到特定群体所持立场的过滤,这导致众多的研究本身就是歪曲的。索洛就指出,“其结果在取得数据之前就已经确定,或者数据被小心地拣选过,以证明某个观点”。

其实,数据选择中的主观性不仅出现在经济学中,甚至也在自然科学的研究中。米托夫就表示,美国国家航空和航天局的科学界在他们的工作中带有一种十分强烈的寻求证实的偏见;多赫提和特温尼发现,被试者在试图评价计算机模拟的人造宇宙的规则时也存在着同样的偏见;而辛德和斯沃密总结说,当被试者试图评价一个有外向型的人的描述时,总是去寻找那些外向行为的证据而不是相反。正因如此,现代主流经济学所谓的纯粹实证研究根本无法把价值判断排除在外。布罗西耶曾指出,“形式主义只能给这种方法带来某种程度上的逻辑一致性”;究其原因,现代主流经济学本身就是根基于特定的引导假定,而引导假定上的差异已经“导致了放弃它们所有关于客观性和科学性的伪装,也使人们认识到这种经济学的形式化明显地掺杂着价值判断”。譬如,社会福利函数就有多种形式,可以是加总的,也可以是乘积的,也可以最大最小值的比较。显然,不同的社会福利函数表达形式就反映了人的意识形态:加总的社会福利只关心总量而不关心如何分配,乘积的社会福利则体现了社会平等的要求,而最大最小值的社会福利则体现了对贫穷者的关心。所以,豪斯曼和麦克佛森就强调,“即使纯粹的实证经济学,经济学家们也必须考虑所研究的社会和他们自己的道德规范”。

(三)分析模型中的变量确定具有随意性

计量分析的基本目的在于揭示两个现象之间的关系,并主要表现在三大方面:(1)是否有关系?(2)关系的强度如何?(3)关系为何种形式?但是,这三方面检验都存在高度的主观性:第一、二点往往依赖于检验的方法,不同的方法甚至会得出截然相反的关系;第三点则依然于模型的设定,不同的回归方程往往会得出不同的关系形式。同事,对社会经济现象进行计量建模尤其困难。(1)社会因素错综复杂地联系在一起,但基于简约性原则,经济计量模型往往将一些非常重要却无法量化的变量舍掉;因此,变量的选择本身就具有很强的主观性,从而很可能得到荒谬的实证结果。(2)社会经济现象的研究关键是要揭示因果联系,但流行的计量模型在选择因变量和自变量时往往基于时间先后,这就很可能颠倒了因变量和自变量的关系;同事,很多变量也很难在时间上显示出来,乃至不同的计量模型往往会随意调换因变量和自变量。上述种种都表明,尽管计量实证看似给出了“客观”的数据分析,但其中却充满了非逻辑的因素。

其实,针对当前经济学界的计量实证分析,北京大学计量经济学教授朱家祥就总结了三方面陷阱。(1)就相关性研究而言,在相关系数和回归分析这一假象的背后往往是:先有变数间的相关性结果,才回头杜撰经济议题。例如,20年前办公桌上有无电脑的一个虚拟变量很可以解释工资的差异性,此时由人力资本的投资而提高技能成了这个实证结果的解释;但是,究竟是会操作电脑提高了工资,还是因为工资高(职位高了)才有使用电脑的机会?(2)为了炫耀方法而勉强套上问题,计量方法这一工具不是用来发掘问题而是用于发表论文的。例如,Nelson and Plosser 的单根文章发表后,单根检验的计量方法蔚然成风,突然间,什么数列都有了单根,垃圾论文一大堆;同样,Engle的方差异质性问世后,几乎到处全有了ARCH 效果。(3)数据挖掘,不断重复使用同一数据,运用各种计量模型与方法,直到找出符合自己期望的实证结果为,以致这种屈打成招出来的模型全无预测能力。正因为计量实证的过程中充满了欺骗和误导的行为,如用以偏概全的数据说谎,也应该知道很多经济理论常禁不起数据的考验,如“南郭”经济学家惯于将简单事实复杂化;因此,实证计量的研究者应该怀有罪人的心态,要明白数据挖掘的偏误可能会侵蚀实证结果的正确性。显然,作为一个诚实的学者,我们必须正视目前实证计量中存在的问题,而不是迷信于这些数据的“客观”分析。

(四)经济学论文充满了各种修辞

当前,“为己之学”已渐逝而“为人之学”则日隆,经济学研究和论文写作的主要目标不再是为了增进自身的认知,而是为了发表并取得认同;为此,经济学论文就广泛运用文学修辞、隐喻等带有强烈情感色彩的说服方式。麦克洛斯基就指出,一个理论的内在质量与为此提供支持的措辞对它的成功是一样重要的,因为理论往往也需要依赖于其他学者的评价。一方面,任何科学都是一种有目的写作,其目的在于说服其他科学家,因而科学本身必然会带有某种感情色彩;另一方面,经济学研究本身更是为了应用的目的,是试图对政策产生影响,但在纯粹方法论的基础上很难真正驳倒对立的看法,因而必然会更加自觉地利用其他的修辞方式。为此,麦克洛斯基甚至认为,“区分一个好的经济学家和一个差的经济学家,或者甚至区分老的经济学家和年轻的经济学家,需要额外的关于修辞的综合知识。”他以一般均衡理论为例作了说明,一般均衡本身既不现实也无应用价值,但德布鲁为捍卫这个抽象的一般均衡分析,就用了大量的修辞,诸如:“该理论满足了很多为理论而寻求理论的当代经济理论家的智力需求”,“简约而又具有一般性”是“一个有效理论的主要特征”,“它们的美学诉求足以使它们达到对一个理论设计者而言本身合意的结果”,等等。

其实,计量分析之所以得到如此多人的偏好,就在于,流行的观点往往将计量视为“客观”的,从而计量分析成为增强说服力的一个重要手段。也就是说,计量分析是当前经济学人所使用的一种措辞,这就如各种比喻、故事等一样,只是更为当前学术界所接收。通过对大量经济理论、模型和论文的分析,麦克洛斯基就指出,尽管“经济学家宣称自己论辩的基础是统计推断、实证经济学、操作主义、行为主义或者其他实证主义变种当中的有效内容。他们相信这些就是科学的唯一基础”,但是,他们“在实际所从事的科学工作中,他们不断地论证经济学隐语的适宜性、历史先例的实用性、内省方法的可信性、权威的力量、对称的优美、道德感的召唤等等”;事实上,尽管“严格的实证主义认为,这些东西都是‘毫无疑义的’、‘非科学的’或‘仅仅是一堆意见’而已”,然而,“实证主义者们实际上也不能摆脱对这些议题的讨论。事实上,多数科学讨论,尤其是经济学讨论,都是根源于这些议题的。要是死守着‘科学方法’,或者死守着任何原则(诚实、清洗和宽容出外)不放,那就什么也得不到”。

(五)经济学研究也根本离不开价值判断

一般地,只有在纯粹的孤立的个人与自然之间的关系领域,对个人的理性行为的分析才可能是纯粹实证的;相反,只要个体的行为涉及到他人,就必然隐含了意识形态的考虑。相应地,经济学的任何问题都必然会涉及到社会关系和利益的分配,从而也必然无法做纯粹客观的实证分析。这正如布罗西耶指出的,“从社会学上说,经济理论,无论它是实证性的还是描述性的,都以另一种方式保持着规范性质:根据构建理论使用的概念,它允许人们获得某种关于他们所生活与行动的社会的世界观。换句话说,经济理论是一个表达系统,通过它人们可以思考这个社会及其与它的关系。”同时,作为实证主义的教父,弗里德曼宣称,“实证经济学在原则上独立于任何特定的伦理立场或价值判断的。……实证经济学是,或者说能够成为一门自然科学意义上的‘客观’科学”,而“规范经济学及经济学的艺术也不可独立于实证经济学。任何政策结论都必然基于对‘做某事而不做另一事’所导致的结果的推测,而推测则必然或隐或显地基于实证经济学。”果真如此吗?克莱因就写道,“弗里德曼无疑会被认为他的‘实证经济学’避免了主观评价。实际上,他一直试图把市场配置本身提升为一种价值前提,在他看来,以此为基础的结果是最有效的,或者说,如果不是最有效的话,根据他对经济应该如何表现的看法,这些结果比任何其他配置机制的结构都更可靠。他认为人们应该‘相信市场’,因为不论市场有什么缺陷,它总是比非市场机制表现得更好。”

其实,客观性仅仅是经济学努力不断接近的目标,但在现实中却永远不可能达到,更绝非是现实的存在。华勒斯坦就写道:“客观性可以被看成是人类学习的结果,它代表着学术研究的意图,并且证明了学术研究的可能性。学者们彼此之间竭力地想说服对方相信自己的发现和解释是有效的。他们仰赖于这样一个事实:即他们所适用的方法能够为他人所重复适用”。因此,针对流行的“客观实证”观,我们就应该持慎重态度。(1)社会科学领域的任何理论都无法被彻底证实或证伪,从而根本无法满足自然科学的“还原”和“实证”的要求;(2)在现实世界中,那些热衷实证分析的学者为了私利的目的还会刻意地利用各种复杂的数理模型在“客观”的伪装下推行自己特定的成见。米洛斯基就指出,对“客观性”的追求,“看起来它应该为经济学家制造特殊的问题,因为在对一个被利益和贪婪所驱使的世界进行描绘的活动中,看起来除了有空洞而虔诚的口头禅之外,似乎没有‘客观性’的位置。”同样,韦森也质疑道:“经济学家作为一个‘学术人’,其经济学的分析是否能透过他所处社会的文化信念并超越自己潜在的价值观(或言超越熊彼特所认为的那种永远挥之不去且永远伴随着我们的种种‘意识形态’)去发现人类社会运行‘自然秩序’或言‘天道’?”这意味着,尽管一些“主流”经济学家热衷于打客观性的幌子,但实际上都是在推行他们自己的主观观点。这正如哈耶克所说,“在决定什么样的问题值得回答的时候,就已经涉入了个人的价值判断”。

总之,尽管现代主流经济学基于逻辑实证主义而强调实证经济学的科学性和客观性,认为实证经济学仅仅对现状的分析和解释,而描述“是什么”是客观的,这种解释并没有真正的说服力。而且,尽管现代主流经济学崇尚研究的客观性和价值中立,但它根本上没有撇开先见的价值观而从事所谓纯科学研究。(1)基于逻辑实证主义的分析和解释本身就是在特定的引导假定之下,而特定引导假定的存在本身就体现了实证分析的主观性;特别是,现代的逻辑实证基本上都是在新古典经济学的框架下,从而带有特定的意识形态。(2)每一学者在分析问题时都必须根植于一个特定的背景之中,这就不可避免地会产生各种偏见;因此,根本不存在什么中立的学者,根本无法撇开先见的价值观而从事所谓纯科学研究。(3)任何纯粹的实证分析都不可能孤立存在,相反总是与特定的应用目的联系在一起;正因为实证经济学和应用政策经济学之间也无法完全隔离,因而实证分析也就必然无法离开主体的价值判断。为此,布罗西耶指出,“从社会学上来说,经济理论,无论它是实证性的还是描述性的,都以另一种方式保持着规范性质:根据建构理论实用的概念,它允许人们获得某种关于他们所生活与行动的社会的世界观。换句话说,经济理论是一个表达系统,通过它人们可以思考这个社会及其与它的关系”。罗斯巴德则写道:“大多数经济学家都嘴上说的好听,不允许以经济学家的身份做出伦理判断,但在实践中,他们要么漠视自己的职业标准,要么通过精心设计的程序逃避它们。”

四、不见经济规律的研究结论

现代经济学人越来越热衷于使用统计工具以及更为精良的计量分析手段来描述和解释社会经济现象间的关系,并试图从中发现经济规律而建立经济理论体系。但在实际中,迄今基于经验材料的量化分析所揭示的根本上都只是具有特殊性的统计规律而非普遍性的经济规律:前者主要反映变量在数量上的某种相关性,最多体现了特定时间或范围内的变化趋势;后者则主要反映事物之间在相互作用上的因果关系,需要深入事物的内在结构和作用机理。事实上,基尼系数、恩格尔系数、帕累托法则、鲍利定律、康德拉耶夫周期、库兹涅茨周期等都只是统计定律,主要体现了各种具有相反趋势并相互抵消的事实的一个巧合。斯皮格尔就写道:“谈及消费者收入与支出之间关系的恩格尔定律和关于收入分配的帕雷托定律,与厂商的增长有关的吉布拉特比例效应定律也是经验的。经验法则的特性使它们只能具有或然性的有效性”。

(一)有关收入分配的几个“常数”

为了让读者更好地来理解这一点,这里以被现代主流经济学视为规律的几个收入分配“常数”作一剖析。

首先,帕累托曾将一个社会中较高收入个体的收入分布用公式表示为:

24.png

其对数形式为:

25.png

其中,Y为一定的收入水平(帕累托用的是高于社会全部收入的众位数),N为收入大干Y的人数占总人数的比例。帕累托集中讨论了α值,估计的值在1.5-1.7之间;而且,收入越平等,α值越大。帕累托的计量结果表明,不管考察哪一个国家,所形成的曲线总是与Y轴大体成56度角;也即,不管一个国家的平均收入水平高低如何,收入的分配总是一样的。这就是帕累托收入分配定律,它在世界范围内引起了很大兴趣和很多批评。帕累托的继承者、美国数学家H.T.戴维斯对该定律作了改进,使之成为社会稳定的一个条件,并称之为对历史的数学解释。戴维斯推测:当α值显著高于1.5时,会导致右翼发起的贵族阶级革命,因为如此之高的α值预示着有特殊才能的人缺乏足够的空间;当α值显著小于1.5时,会导致左翼发起的无产阶级革命,因为如此之低的α值预示着社会底层会遭受严重的剥削。后来日本的哈利.大岛等人提供的数据表明,阶级发展的最终趋势是降低不平等程度,故α值会随着时间而增大。

其次,英国统计学家亚瑟.鲍利研究了英国一战前一代人(1880-1913年)的功能性收入分配而首次发现了鲍利定律(Bowley's law):劳动在国民生产总值(GNP)增长中的比例保持稳定;而且,这似乎不仅是短期现象,而且是长期现象。针对鲍利定律,存在着两种看法:(1)最初的看法肯定了鲍利定律,但认为还缺乏足够有效的解释。例如,克莱因就将劳动收入份额的恒定列为经济学的“五大比例”之一,并在建立经济学模型时将其处理为常数。不过,正因为经济理论还无法充分地解释鲍利定律,罗宾逊夫人称之是对整个学科的“谴责”。(2)后来逐渐意识到鲍利定律的错误,把它视为仅仅反映特定时期的特定现象。例如,如果劳工组织逐渐壮大,劳工力量将会且应该提高劳动收入的份额。同时,后来马克卢普对美国的研究也反映了份额的变动性,美国1945-1960年间的劳动份额在63.6%至68.9%之间,而1929-1960年间则在58.2%至73.4%之间变化。

再次,温特劳布则进一步发展了鲍利定律中的神奇常数,他用

25.png

表示企业的生产总值,wN表示企业工资;其中,w是平均工资,N是平均就业人数。同时,令劳动份额占企业总产出的比重为1/k。于是就有:PQ=kwN,或P=kw(N/Q)。同时,如果将Q/N定义为A(平均劳动生产率),而w/A定义为R(工资率与平均劳动生产率的比率);那么,上式就转化为P=k(w/A)=kR。温特劳布通过美国的数据观察到,k是一个介于1.9至2.0之间的一个常数,且在第二次世界大战后有轻微的下降趋势。因此,温特劳布坚持认为,企业国内生产净值中的工资份额是个常数。问题是,在不同时空下,这种神奇常数果真会保持不变吗?显然,只要看看中国改革开放的这30年间资本和工资所占的收益份额就一清二楚了。

事实上,计量分析所揭示的经济关系只有在社会制度等大环境保持稳定的情境下才会存在,而这些社会经济环境恰恰是不稳定的,它会受到人类行动有意识的改造。为此,萨缪尔森在20世纪60年代就曾写道:“半个世纪以来,各种具有相反趋势并相互抵消的事实可以被认为是一个巧合,并且无法保证它们将重复发生。(我)意识到经济学‘法则’在经济生活中时多么的变化莫测:例如关于工资份额为常数的鲍利定律、关于劳动力的参与率为常数的龙氏法则(Long’s Law)、关于不变的收入不等式的帕累托法则、关于财富-收入常数比例的莫迪利安尼法则以及关于真实工资和(或)利润率下降的马克思法则、关于资本-产出常数比例的无一例外法则(Everybody’s Law)。如果这些都是法则,那么大自然就是一个罪犯。同时经验也告诉我需要对巧合保留必要的怀疑,在许多情况下,即使它们不能解释事实,它们也能描述事实,直到他们丧失描述的功能。”

(二)库兹涅茨的收入分布曲线

我们再以库兹涅茨的“倒U型收入分布”曲线为例加以说明。新古典经济学者往往将此当作市场经济收入分发展的基本规律,不仅为市场经济的有效性辩护,也为当下巨大的收入差距辩护,因为市场总会解决一切问题。问题是,“倒U型收入分配”曲线果真是自由市场自发作用的结果吗?库兹涅茨的“倒U型收入分配”曲线主要是以西方社会近百年的历史数据资料为依据。库兹涅茨的分析是:“没有足够的经验证据来检验这个反应长期收入不均等程度的曲线,也无法划定各阶段的准确时间。但是,为了让这一曲线看起来更为明确,我将把收入不均等可能扩大的早期阶段进行如下划分:英国在1780-1850年间;美国在1840到1890年间,尤其是在1870年后;德国在1840到1890年间。我会把美国和德国收入不均等缩小的阶段划在英国之后,美德大概始于一战,英国始于19世纪最后25年。”进一步的问题是,尽管西方资本主义社会普遍实行的是自由市场,但现代社会的市场机制还是早期“普力夺”的市场机制吗?

其实,库兹涅茨描述的“倒U型曲线”前一阶段的收入分配差距不断拉大反映了早期自由放任资本主义的现象,是在市场机制很不完善的情况下完全由力量博弈的结果;“倒U型曲线”后一阶段收入分配差距逐渐缩小则是人类对市场机制的干涉结果,因为在社会主义学说引发了体制外抗争以及改良主义学说主导的体制内变革之共同作用下,在社会底层阶级的对抗压力以及开明立法者的有意识努力之共同努力下,西方资本主义制以及相应的市场机制发生了很多的变化。也就是说,“倒U型曲线”中前一段的扩大主要源于自发市场的马太效应,这种马太效应最终会导致社会收入分配两极化,这也是坎梯隆、马克思等很早就提出的所有权集中规律;相反,“倒U型曲线”中后一段的缩小主要源于社会干预的转移效应,这种社会干预主要促使弱势者的力量联合和直接的立法来保障弱势者的基本诉求,这也是康芒斯、加尔布雷思等强调的抗衡力量。

同时,迄今为止针对“倒U型曲线”的检验结论也各不相同。例如,Galor和Tsiddon(1997)利用技术进步决定工资不平等的发展路径的假设,论证了收入不平等倒U曲线的存在性。Lin et al (2006)利用与Huang同样的75个国家数据,设定GINI系数半参数模型,将人均GDP作为非参数部分的解释变量,其它控制变量作为线性参数部分的解释变量,由径向基(radial basis)惩罚样条(penalized spline )逼近未知的非参数函数,考察Kuznets倒U型曲线的存在性问题,结论也是支持倒U型假说。但是,Deiniger和Squire (1996)设定的面板数据模型的估计表明,对于大部分国家样本数据来说,倒U型曲线的假说不成立;只有约10%的样本(仅5个国家的样本)的面板数据模型估计结果支持倒U型曲线假说。事实上,对Kuznets倒U型曲线的估计和检验往往依赖于数据类型:对于横截面数据模型,检验的结论大多支持倒U型曲线假说;而面板数据模型的实证结果常不支持倒U型曲线假说。同时,对Kuznets倒U型曲线的估计和检验还依赖于模型的设定形式:模型形式的简单性可能导致模型设定的偏误,导致经验论断产生差错。

(三)关注计量结论的局限性

上述的剖析提醒我们,要注意计量结论的局限性。布朗芬布伦纳就强调,“一个过分程式化的所谓事实将不再是事实。”事实上,奥地利学派就拒绝以计量经济学作为经济理论的工具,认为计量分析并不能发现或确定经济规律。其所持理由有三:第一,由于推论出经济规律的这些公理被当做是断然真实的,除非推论过程有错误,理论自身也必定是真实的,从而无法也无须用统计方法加以证伪;第二,行动往往包含了反事实要素,它无法直接观测到或证实;第三,经济生活中没有常量,因而确定此类常量的任何努力都是徒劳的。

很大程度上,现代主流经济学之所以关注“量”的精确而忽视“性”的意义,热衷于数理的逻辑推理而否弃生活的日常语言,就在于存在韦森所讲的“致命误解,那就是经济学家们常常认为,由于日常语言是模糊的。故用日常语言所写的经济学,自是公说公有理,婆说婆有理,因而还不是‘科学的’。正是基于这一天大的误识,致使当代主流经济学家错误地相信,只有通过数学公式所推导证明的经济学道理,才是‘科学的’。相当多的经济学家也由此错误地断定,一些用日常语言所撰写的经济学,还不是‘科学’。这是当代经济学中数学模型的构建成为时尚、数学推理大行其道的根本认识论原因。”

不幸的是,尽管现实社会经济中并不存在固定不变的神奇常数,但依旧有很多经济学人热衷于去挖掘这种常数,并把它视为一项“伟大”发现。为什么呢?温特劳布就为之辩解说,“很多人对于经济学中的一些重要的具有一致性的证据感到不安……我甚至曾经遇到过这样一种奇怪的观点,认为承认一个函数关系比承认经验上的近似常数更加有意义。这不是等于认为一幅图中的一条水平线的影响力弱于一条定义模糊、位置以及稳定性都不确定的曲线吗?这样模糊的‘函数’是否能够从经验中识别并在分析中利用近似常数推进我们的科学呢?”问题是,模糊的函数关系往往只能给与人们一种思维启发,而所谓量化常数却会给出具体的政策设计,从而影响更为深远。

不过,一旦常数本身是错的,那么它造成的后果也将更严重。对此,布朗芬布伦纳评论道:“模糊的函数相对于精确的常数的优势并不在于前者能从模糊的处理、数学上的弱化或者注入x=F(y,z)的学究式的论调中提供更多的洞见,而是在于它们可以避免那些仅仅基于某种观测到的比例而得出复杂的理论构架、推广以及‘具体的谬误’。”尤其是,流行的计量分析还以函数关系来代替因果关系,以数量关系来取代实质关系,甚至在还没有形成一个可以被事实推翻的假说之前就直接进入到对一个变量作相关性分析,并以此给出相关或不相关的结论。

总之,流行的计量分析往往无法全面揭示自变量和因变量之间逻辑关系以及作用机理,从而必然无挖掘出具有预测力的经济规律。例如,McCloskey和Ziliak研究了《美国经济评论》在20世纪80年代所发表的182篇完整论文后就发现,有70%的论文都没有能够将统计意义从政策和科学意义(也即经济意义)中区分出来,有96%的文章误用了统计检测;在那些混淆统计意义和经济意义的70%的文章中,又有约70%错误地报告了他们所调查的经济变量之间的影响级数。也即,《美国经济评论》20世纪80年代发表的文章中有大约一半的经验文章并没有建立起他们所宣称的那个经济意义。面对这一研究结果,一些经济学家的反应却是:是的,我们知道把符合标准视同实质重要是愚蠢的,但我们不会这样做,只有一些糟糕的经济学家才这样做。而且,这些经济学家还宣称,1996年后的情况已经开始改观。然而,Ziliak和McCloskey于2004年又对《美国经济评论》在20世纪90年代所发表的文章再次作了分析后却发现,情况非但没有好转,反而恶化了:在137篇使用统计检验的文章中,82%的文章将只有统计学意义的发现误解为经济学意义的发现;绝大多数(81%)文章认为,观察到相关系数的信号就足够代表了科学,而这种错误导致了经济遭受损害:工作和正义的丧失以及真正的人类生活。

原标题为:不要迷信计量实证-兼评陆铭的《把实证研究进行到底》

文章评论
关注我们

快速入口
回到顶部
深圳网站建设