Page 10 - 《华中农业大学学报(社会科学版)》2020年第1期
P. 10

第 1 期                    罗必良: 贫困、 RCTs及其争议——— 2019 年诺贝尔经济学奖简评                          5

     RCTs试验的基本过程可以分为五个步骤.一是确定试验人群.以节水宣传为例.由于节水涉
   及居民的资源消费, 需要先确定进行实验的居民区: 是一个小区还是若干个小区; 若干个小区是集中
   在一起还是分布在城市不同方位, 或者是在不同的城市.二是随机分组.试验者将试验对象随机分
   成一个控制组以及一个或多个干预组.随机分组的目的是要消除不同组别之间的系统性差异, 从而
   保证可比性.其中, 一个重要的工作是基线调查并经过统计检验, 以确保组别之间没有显著差异.三
   是试验干预.控制组的居民像他们往常一样的生活, 而干预组的居民会受到明确界定的干预措施影
   响.例如, 干预措施可能包括发放节水传单或进行上门游说等多种方式.关键是要确保干预组受到
   干预, 且干预措施没有溢出效应, 控制组没有受到“ 污染”.四是数据收集.可以通过问卷、 实地检测
   和经济学游戏等多种手段实现.五是对数据进行处理和分析, 并得出结论.通过与控制组的对比, 观
   察干预组的行为变化, 由此揭示干预( 或政策措施) 的效果及其行为发生学意义.
       以往的实证研究存在两个突出的问题.一方面, 尽管越来越多的微观计量方法逐渐被开发出来,
   从一元回归到多元回归, 进而到样本选择模型、 固定效应模型、 双重差分法、 工具变量法、 断点回归法
   等更高深的计量模型, 试图解决研究对象的可比性问题, 但各自均存在局限性.尤其是遗漏变量、 双
   向因果等问题的广泛存在, 使受到某种干预的个体和没有受到的个体之间常常不具有可比性, 因而存
   在不可信的问题.另一方面, 由于政策的颁布与实施总是滞后于现实需求, 尽管有些备选政策具有理
   论上的逻辑合理性, 但是否具有实际可操作性往往是未知的, 尤其是人们无法观察到新的政策选项与
   已实施的政策是否存在消长或冲突, 更是不确定的.所以, RCTs方法在理解政策绩效的可信性与确
   定性方面具有不可比拟的工具性优势. RCTs方法的“ 实地” 特性, 因为更加贴近现实, 所以成为检验
   和认识已有经济理论、 逻辑假说、 政策策略的重要工具.这类方法无疑能够鼓励和激发“ 直面现实” 和
   “ 问题导向” 的微观研究.由 Smith 等           [ 7 ] 发展的实验室实验研究方法于20 世纪中叶逐渐兴起, 而田野
   实验尤其是 RCTs方法基于对实验室实验的反思与改进, 现已成为一个重要的经济学研究领域和数
   据来源.甚至有人将其称之为“ 21 世纪的经济学方法”.

      三、 对 RCTs方法的争议


     2019 年诺奖的颁奖指向, 表面看起来关注的是扶贫( 研究对象), 但实质上是关注于内生性问题
   的处理方法( 研究方法).事实上, RCTs方法并非是三位新科获奖者的新发明, 它的应用由来已久.
   该方法最初是一种对医疗卫生服务中的某种疗法或药物的效果进行检测的手段, 常常用于医学、 药
   学、 护理学, 以及生物学与农学的研究中, 在司法、 教育、 社会科学等其他领域也有所应用.只不过是
   最近十多年在研究贫困问题的发展经济学圈子中, 该方法格外盛行而成为“ 标准” 与时尚.应该说, 对
   于 RCTs方法的有效性, 一直存在争论.只是 2019 年的经济学诺奖使得这些争议格外引人注目.
       事实上, 即使 RCTs在医学领域应用广泛, 但其方法的有效性至今依然没有达成共识.不久前
   Frieden在久负盛名的« NewEn g landJournalofMedicine » 发表文章, 从公共卫生的角度对 RCTs的
   局限性进行了较为全面的评论              [ 8 ] .他强调: 第一, 尽管 RCTs的内部效度很强, 但无法将研究结果推
   广至研究人群以外.第二, RCTs的研究期限或样本大小通常不足以评估治疗效应的持续时间( 例
   如, 疫苗免疫效果下降) 或发现治疗中出现的罕见严重不良反应, 这些通常在上市后监测和长期随访
   中变得明显, 但在 RCTs中实际无法进行评估.第三, RCTs越来越高的成本和时间限制也可能造成
   研究者的选择性设计.例如, 选择高危人群进行研究, 但这些人群可能与更广泛的目标人群无关.第
   四, RCTs评估个体化治疗效应的能力也有限, 如外科手术的不同操作, 同时 RCTs对罕见疾病而言
   通常不切实际.因此, 他认为, 对于健康干预研究, 并没有千篇一律的最佳方法; 没有研究设计是天衣
   无缝的, 所有类型的研究都可能出现相互矛盾的研究结果.他提供多个例子说明, 不同的数据来源均
   有其优点与缺点, 临床和公共卫生决策的数据依据几乎总是不完整的.特别要提醒的是, 在 RCTs数

   据之外, 绝对不能排除观察性数据的重要性.
       在经济学领域, 更是存在类似的质疑. Mader等怀疑 RCTs能否产生适当的证据, 因为该方法看
   5   6   7   8   9   10   11   12   13   14   15