计量经济学建模_计量经济学中的前沿方法——随机干预试验方法简介
来源 | 当代教育实践与教学研究
作 者:杨云帆,北方民族大学经济学院

内容提要
关 键 词:计量经济学;随机干预试验方法;分析能力
一、引言
计量经济学运用经济理论与统计学方法来分析经济数据,并被视为一门系统性研究这一领域的学科。这门学科着重于构建反映变量之间因果关系的模型,并通过这些模型来理解经济现象的本质规律及其动态变化机制。比如,在教育计量经济学领域中,研究提供奖学金是否能够提升学生的学业成绩;而在健康计量经济学领域中,则探讨烟草征税措施如何影响吸烟行为的变化幅度。这些问题的答案都建立在对变量间因果关系的定量分析基础之上并辅以实证检验以验证其合理性
研究证实,在心理学、医学等众多领域中广泛应用的一种称为随机干预试验的技术手段,可视为理解因果关系的重要工具。作为一种关键步骤,在新药获得上市许可之前作为一个必要前提,在临床试验阶段通常会采用这种方法来验证其疗效与安全性。具体而言,在新药上市前通常会进行临床试验:选取一组患者接受该新型药物治疗,并另一组给予安慰剂或其他无害药物治疗;通过观察两组患者的治疗效果差异来判断该新药是否具有显著疗效与安全性。只有在经过严格评估后证明其效果显著且安全性良好之后(即所谓的"成功案例"),相关机构才会决定批准该药物进入市场
著名计量经济学家Stock和Waston主张,在选择教学内容时应着重考虑随机干预实验方法的价值。其理想化的概念为评估因果效应估计提供了基准;其次,在这类实验结果具有显著影响力的同时掌握其实验局限与优势至关重要;再次,在实验经济学中获得的经验教训往往适用于准自然实验
在上述背景下, 本文重点阐述了随机干预试验方法在计量经济学中的应用, 涵盖其基本方法、操作步骤以及结果分析, 并最终探讨了该方法的优缺点
二、随机干预试验方法概述
随机干预试验的主要目标在于识别因果关系的具体表现形式,在此过程中与未实施政策(或干预措施)的结果进行对比分析。随着研究周期的延长, 随机干预试验的影响程度也会随之变化, 如下图所示。

随机干预试验示意图
随机干预实验是在控制其他因素恒定时识别哪些结果和变化是因为某个特定因素的干预而产生的;因此需要运用反事实分析方法来进行研究。依据在于从统计学上讲, 因果关系是指可观察的事实与其对应的反事实之间的区别. 从反事实的角度出发, 因果关系可以用以下方式表示:

在这里Τ是指因果关系;π指所有调查对象在干预组中的比例; (1-π) 表示所有调查对象在对照组的比例;w是一个虚拟变量, 其中1代表个体在干预组,而0代表对照组;Y1和Y0分别指代干预组和对照组的成员在因变量上的取值;E则是取期望值的意思。上述公式中, E (Y1|w=1) 或E (Y0|w=0) 是可观测到的事实, 而E (Y1|w=0) 和E (Y0|w=1) 则是反事实。因果关系T就表示为干预组中的个体其“事实”与“反事实”之间的差异即E (Y1|w=1) -E (Y0|w=1) 与对照组中的个体其“事实”与“反事实”之间的差异。随机干预试验中一直存在一个问题是我们永远也不可能观测反事实是什么。因为在某项特定的研究中, 某一群人只可能在干预组或对照组, 而不能同时在两组中出现。这被称为“因果推论的基本问题” (Holland) 。为了做出因果推论, 我们希望能够满足以下条件, 这在统计学上称为“非混淆假设” (unconfoundedness assumption) :

如果满足非混淆假设, 因果推论公式就简化为:

当公式右侧的两项均为可观察变量时, 我们可以得出因果结论。
是否能够进行因果推断则主要取决于是否存在足够的条件满足非混淆假设。
随机化是一种广泛应用于统计学的方法; 因为干预个体是通过随机方式分配到干预组或对照组中的, 变量w与最终的结果变量Y1或Y0之间不存在直接关联。
换言之, 无论w取值为0还是1时,E(Y1)或E(Y0)的期望值都是恒定不变的。
然而在实际操作中, 完全实现严格的随机化是比较困难的; 因此我们通常采取措施来控制可能存在的混杂变量; 经过这样的控制后,w与Y1或Y0之间的关联程度会得到显著降低。
换言之我们希望达到:

在实践中, 为了识别干预组人群与对照组人群在经过干预后的主要差异, 研究人员必须遵循一个由三个阶段组成的随机化干预研究流程: 首先进行基线调查作为研究起点; 其次实施系统性地设计与实施的干预措施; 最后通过评估调查收集并分析效果数据。这一研究流程的核心环节主要包括: 开展基线调查作为研究起点、随后实施系统性地设计与实施的干预措施以及通过评估调查收集效果数据(张林秀, 2013)。
基线调查用于在项目干预之前对项目的参与者进行基本状况了解,并且通过系统地收集主要的结果变量以及可能影响这些结果变量的关键控制变量的数据信息来确定核心数据信息。
干预试验:根据随机化分组的原则将受试者分为干预组与对照组,并在整个干预过程中实施监督以确保项目的顺利推进。例如,在项目的执行过程中可能会出现部分受试者中途退出的情况, 但必须确保最后因故退出的受试者与继续参与的受试者在基础特征上存在显著差异。
在进行评估阶段时,在预期受到干预的影响显现之后就可正式开展该阶段的工作;整个过程需要涵盖在基线阶段所收集的所有信息指标以及关键成果变量的测量工作。在此过程中最常见的挑战就是研究对象的退出问题;在这种情况下就需要细致核实参与者的身份信息并严格区分处于跟踪期间的不同群体成员以明确界定各时间段的样本构成情况。
在此情境下需要考虑的是参与者退出可能带来的负面后果;因此必须采取适当的措施以保证研究数据的质量不受影响。
三、随机干预试验的结果分析
在调查工作结束后, 基于收集到的数据便可开展随机干预试验结果分析工作。通过实验设计框架下的基线及评估两个阶段的数据对比, 可以得出相应的结论。基于实验设计中的干预组与对照组,在基线及评估两个阶段的数据基础上建立面板数据分析模型

上式中: Δyi表示评估期与基期的结果差异;被关注的结果变量y是我们研究的核心指标;ΔTreati是一个二元指示变量,在缺省情况下代表对照单元组;εi是随机误差项;β1的估计值反映干预措施相对于对照单元组的影响程度。(7)式若进一步引入其他控制变量,则相应的回归方程变为:

式中Y为ΔXi的系数变量;对于那些基期与评估期保持不变的控制变量,在式(8)中未被包括在内;如果干预行为严格且有效,并且严格按照既定程序执行,在不受其他因素干扰的情况下,则计量模型所估计的影响大小β1即为我们预期的干预效果。
四、讨论
尽管随机干预试验在理论上被视为影响评估的"黄金准则"(gold standard),但其实质应用仍面临着诸多现实挑战。例如,在参与实验的人群中可能存在较高的霍桑效应(Hawthorne effect),即人群的行为受到自身观察的存在而受到影响;此外,在实验过程中出现中途退出的参与者其离场原因可能与干预措施本身有关联, 这就可能导致基于最小二乘法(OLS)估计得出的结果存在偏差
此外, 以人为主体的研究成本往往高昂, 因此这类项目通常局限于较小规模。然而, 样本规模有限可能会影响研究结果的有效性。做这项研究的目的在于推广这种干预措施的效果。但若在一个国家实施某项政策并显示出效果,并不能保证在另一个国家会有相同的效果,则这项试验带来的优势将不复存在。此外, 这类研究常因涉及伦理问题而受到质疑。例如,在某个地区发现儿童贫血现象后,实施的补铁方案旨在改善贫血状况;然而,在对照组中由于无法获得额外的铁元素补充(因未参与干预),因此进行此类随机干预实验必须经过伦理委员会的严格审核。
尽管还存在一些问题, 现如今日越来越多的经济学家开始采用随机干预试验的方法进行研究。原因之一便是即便是在《美国经济学季刊》这样顶级期刊上发表的文章中也经常出现错误(McCloskey 和 Ziliak, 1996)。然而这一方法的有效性得到了有力地回应了一些质疑。例如哈佛大学著名经济学家Zvi Griliches表示他从未见过超过4个变量的数据分析情况。此外随机干预试验研究的一个显著优势是可以有效地减少控制变量的数量这一特点吸引了许多领域的关注因而成为相关研究的重要创新成果之一其中以麻省理工学院Duflo教授为代表的一系列研究者因其卓越贡献获得了2010年度克拉克奖
由于随机干预试验在实践中的广泛应用越来越多, 许多计量经济学教材也会纳入这一部分内容以便帮助学生更好地理解相关的理论知识 (Stock and Waston, 2007) 。本学期在讲授计量经济学课程时, 我特意安排了一节关于随机干预试验基本思想的教学内容并特别强调培养学生的批判性思维能力以便提升他们对模型有效性的认识。
参考文献
[1]James H. Stock 和 Mark W. Watson 著,《计量经济学导论》,第2版[M]. Boston: Addison Wesley, 2007
[2]Holland, Paul W.Statistics and Causal Inference[J].Journal of the American Statistical Association, 1986
[3]张林秀.随机干预试验——影响评估的前沿方法[J].地理科学进展, 2013
The study by Mccloskey, Deirdre N., and Stephen T.Ziliak highlights the importance of the standard errors in regression analyses as a critical component in econometric research. Published in the Journal of Economic Literature in 1996, their work provides a foundational understanding of statistical measures essential for empirical analysis.
