Page 11 - 《华中农业大学学报(社会科学版)》2020年第1期
P. 11

华中农业大学学报( 社会科学版)                                   ( 总 145 期)
    6
   起来往往是由实验方案决定了问题                [ 9 ] .在某些社会政策辩论中,“ 寻求随机化的东西” 导致了方法论
   的原教旨主义, 随机主义者经常将试验( 理想情况下是他们自己的实验) 作为唯一真正可信的证据来
   衡量.科学哲学家卡特赖特( Cartwri g ht ) 一直指责称, RCTs并不能告诉我们究竟什么变量在真正发
   挥作用   [ 10 ] .近期, 2015 年经济学诺奖得主迪顿( Deaton ) 等又专门撰文批评经济学领域的 RCTs方
   法, 并认为进行试验的研究人员和各种组织通常会夸大所得证据的价值, 所以不应该将该方法当作研
                      [ 11G12 ]
   究领域的“ 黄金标准”            .正如由 15 位领先的发展经济学家于 2018 年共同发布的一份公开信所说
   的那样, 随机对照试验和行为主义方法设计实际上忽视了更宏观的图景                                [ 9 ] .
       综合各种批评意见, 主要涉及 7 个方面:( 1 ) 社会干预发生的实际情景通常极其复杂, 其中涉及大
   量发挥作用的影响因素.而且环境一旦发生变化, 这些影响因素很容易消失不见.( 2 ) RCTs作为因
   果识别的方法, 仅仅是多种方法中的一种, 当然有其缺陷.例如, 新药品的 RCTs实验通常只能说明
   是否有效果, 既无法保证项目参与者的同质性, 也不能彻底揭示其内在机理与作用机制.( 3 ) 如果说
   RCTs对于解决严格控制的小样本事件有价值, 但对于大样本或不同情境下的大样本、 特别是涉及公
   共政策的重大问题来说, 局限性就很大.对微观小问题研究的有效性, 并不意味着对解决宏观大问题
   的适用性.( 4 ) 随机对照试验方法论和科学复制存在严重的问题 .( 5 ) 贫困问题不仅仅是个人行为
                                                             ①
   问题, 与公共政策密切相关, 而公共政策的非排他性, 几乎不可能采用 RCTs方法进行识别.( 6 ) 贫困
   与发展并非是微观问题的全部, 它涉及传统文化、 经济结构、 制度安排等多方面的问题, 微观的 RCTs
   显然对此无能为力.( 7 ) 由于随机对照试验非常昂贵, 这不仅将会使研究变缓( 时间的延滞必然导致
   情境变化), 而且往往无法得出结论性的结果.所以学者们强调, 对特定随机对照试验的细节进行详
   细持久的监督和审查、 讨论什么时候应该开展随机对照试验, 什么时候应该采用其他研究方法, 是需
   要谨慎对待的问题.林毅夫教授曾经指出, RCTs这种试图“ 以科学经验为基础的政策来减贫” 的方
   法尽管对于理解一些特定的微观发展项目颇有帮助, 但受成本所限, 实验方法只能去探讨一些小问
   题, 而对于类似产业政策、 贸易开放这种大的政策问题却无能为力, 因此这类研究通常不能满足我们
   对知识空白的最紧迫需求            [ 13 ] .
       在各种批评的声音中, 迪顿的批评是最为专业且系统的                        [ 11 , 14 ] .归纳起来包括: 第一, 相比观察性
   数据, RCTs数据一般样本比较小, 而且大多是对于一个局部地区或者行业的研究, 所以缺乏代表性
   和外部有效性; 第二, RCTs研究只是改善了系数估计的无偏性, 但无法确保因果关系的建立.在很
   多时候, 无偏性未必比降低方差重要; 第三, 不同的 RCTs设计对于同一个问题可能产生不同结果, 并
   不能解决政策制定中的争议; 第四, 因为样本比较小, 所以 RCTs较难产生关于宏大主题的思考和伟
   大思想; 第五, RCTs大多是富人对穷人、 富国对穷国做的, 背后可能体现出高高在上的家长式思维;
   第六, RCTs提供的大多是小修小补、 小打小闹式的政策改进, 而不是长期解决方案.基于上述, 迪顿
   教授强调, RCTs并不是解决发展或者扶贫问题的万灵之药或“ 魔术子弹”.相比基于大样本的观察
   性数据, 它的优势可能没有倡导者说的那么大, 甚至劣势更多.因此, 它不具备替代基于观察数据的
   研究的可能, 甚至在很多时候不如后者效果好.
       迪顿教授的上述批评不一定都完全恰当, 但他强调发展经济学的研究不能从一个极端走向另一
   个极端, 则是恰当的.他在一次采访中表达了如下看法: 在 20 世纪 50G60 年代, 经济学家们开始借助
   回归分析进行计量研究.在他们眼中, 回归分析是一个“ 神奇工具”( ma g ictool ), 可以揭示几乎所有
   事情  [ 15 ] .他们试图对各种事物进行多变量回归, 并在一种因果关系框架内对其进行解释.在现在的
   发展经济学家们看来, 他们也有一个“ 神奇工具”——— RCTs , 但对这个工具的弊端还不甚了解.当然,
   其他任何估计方法也都有其优点和缺点.但我认为 RCTs的弊端很大, 很少能达到人们日益对其高
   涨的预期.人们之所以选择 RCTs , 是因为他们厌倦了关于内生性、 工具变量和样本选取等等的争


   ①  以小额信贷为例, 2010 年一个研究团队对 JGPAL 的研究工作进行了复制, 结果发现数据收集和分析中存在众多缺陷, 且足以使
                                                                                           [
      任何发现的有效性受到质疑.尽管证明了 RCTs的缺陷是如此之明显, 但复制研究的结果并未得到 JGPAL 的认可. Mader等 9 ]
      为此感慨, RCTs研究是如何通过同行评审并广泛被学界视为可靠的呢?!
   6   7   8   9   10   11   12   13   14   15   16