发布时间:2021-11-24  来源:中国财经报 2021年11月20日“绩效新时代”专刊

2021年10月11日,2021年诺贝尔经济学奖得主揭晓,戴维•卡德(David Card)因其对劳动经济学的市政贡献获得了一半的奖项;同时,乔舒亚•安格里斯特(Joshua D. Angrist)和吉多•因本斯(Guido W.Imbens),因他们对于因果关系分析方法论的贡献而分享了另外一半的奖项。尽管三位获奖者的获奖比例不同,但其研究出现了交叉的部分:卡德主要应用了因果推断对劳动经济学领域的问题进行研究,安格里斯特和因本斯则在计量经济学方法论研究中对因果效应以及因果推断进行了深入挖掘与精彩诠释,并将其运用于劳动经济学与教育经济学领域的研究中。“以因果推断的方法进行实证研究”摘取了经济学的王冠。

  智汇   

引入“因果推断” 助力重大政策事前评估和事后评价


今年的诺贝尔经济学奖有3位获奖者。分析发现,3位获奖者的研究领域有部分交叉:加州大学伯克利分校教授戴维·卡德主要应用因果推断对劳动经济学领域的问题进行研究,美国麻省理工学院教授乔舒亚·安格里斯特和美国斯坦福大学教授吉多·因本斯因则在计量经济学方法论研究中对因果效应以及因果推断进行了深入挖掘与精彩诠释,并将其运用于劳动经济学与教育经济学领域的研究。可以看出,“以因果推断的方法进行实证研究”是3位经济学家获得经济学诺奖的共同之处。

    

因果推断是循证决策的关键


近年来,我国不断健全完善政策评估评价制度。2019年10月,习近平总书记在中央经济工作会议上指出,重大政策的出台和调整要进行综合影响评估。2020年11月,党的十九届五中全会通过《中共中央关于制定国民经济和社会发展第十四个五年规划和二〇三五年远景目标的建议》,明确提出,健全重大政策事前评估和事后评价制度。


在政策或项目评估由合规导向“讲求绩效”、优化管理、合理分配资源方向转变的过程中,因果推断可以为政策评估评价,进而为循证决策提供科学合理的技术支撑。


政策评估是循证决策的重要环节。循证决策源自循证医学,核心要义是“使决策建立在经过严格检验而确立的客观证据之上。”美国管理和预算局(OMB)描述了四种相互依赖的证据种类:政策分析、项目评估、基础事实结论、绩效测量。正如乔舒亚·安格里斯特所说:“使用数据回答特定因果关系的经验研究最有价值。”这四类证据的最终指向是找到政策干预与产出效果的因果关系,并作为预算决策的依据。


最近20年来,因果推断及其理论与实践的长足发展,不仅促进了应用经济学领域涌现了大量估计因果效应或因果推断的方法,还开启了学者们在公共政策或项目中应用因果推断来进行效应评估的探索之路:英美等国家在循证决策中愈发重视数据基础设施的建设以及调查证据、定量证据的归因过程。比如:在教育政策(如小班教学的推进等方面)效应评估中,采用了随机试验以估计其因果效应。

    

公共政策评估中因果推断的方法及技术


上世纪80年代以来,西方国家和社会公众对公共政策和财政资金的实施效果的关注度日益增加,促使政府和学界等领域联合进行公共政策或项目的评估,以尽可能公正地履行受托责任。基于因果推断的政策评估成为循证决策和优化管理的重要方法。随机对照实验和准实验成为常见的政策因果推断模型。


随机对照实验方法是因果推断学术研究中的黄金标准,是世界银行等国际组织与各国进行政策或项目的结果评估时所采用的一种方法。随机对照实验基于反事实的逻辑,用Y1i 表示个体 i 受到政策干预的结果,Y0i 表示未接受干预时的结果。那么,政策干预的因果效应则为 ( Y1i - Y0i ) ,( Y1i - Y0i ) 为随机变量,是群体意义上的因果效应,即所谓的 “平均因果效应” 。


对于政策评估而言,随机对照实验是一种理想状态,由于受研究成本、研究观念、伦理约束及实施难度等方面的约束,我们常看到的因果推论的统计与计量方法,仍然是“准实验”的方法,主要有以下几种:


一是双重差分法。双重差分法将全部样本数据分为两组:一组受到政策影响,即实验组; 另一组没有受到同一政策影响,即对照组。分别计算实验组与对照组在处理或干预实施前后的变化量,再计算实验组与对照组之间变化量的差值,共有两次差分计算。改革开放以来,我国多遵循“先试点、再推广”的改革推广模式,为双重差分法的运用提供了广阔的空间。


二是断点回归法。断点回归法适用于临界点问题。假如政策在一个关于个人背景的连续变量上设定一个临界值(比如录取分数线),使临界值一侧的个体接受干预政策(比如上大学),另一侧的个体不接受干预政策(比如不上大学),由于个体在连续变量的取值落在紧邻临界值两侧可以看作是随机的,即临界值两侧的个体(略低于或略高于分数线的学生)应该是可比的,这两侧的个体在产出上的差异就应该是干预(大学教育)造成的差异。当前,中国经济正处于转型升级阶段,存在一些类似分数线式的“一刀切”政策,这为利用断点回归法评估政策提供了绝佳背景,比如,扶贫过程中对于贫困县以及贫困县的选定以低于某一平均收入水平作为标准,因此可以利用断点回归法对扶贫政策效应进行评估。


三是工具变量方法。工具变量方法比较适用于存在不完全依存性的随机实验环境中,即政策干预的实验个体无法完全服从随机分配。此外,工具变量还用于自然实验的观察性研究、测量误差、存在内生性的非线性模型等其他情形。假如我们要研究变量W(上学年限)和Y(收入)之间的因果关系,但考虑到其他影响变量U(智商)也会影响Y(收入)的情况,可以引入工具变量Z(一个人的出生季节或月份),该变量的特点在于和W(多上一年学)相关,但与其他影响变量U(智商)不相关。这样,我们就可以更为清晰地考察Z(一个人的出生季节或月份)对Y(收入)的影响。如果Z(一个人的出生季节或月份)很明显影响了Y(收入),我们就可以得出W(上学年限)影响了Y(收入)的结论。

    

引入因果推断方法提高政策评估质量


引入因果推断对于新时代开展政策评估工作是大势所趋,并从以下几方面拓展达标考核型和合规审查型政策评估范式。


——政策评估设计应强化理论驱动和归因分析。传统公共政策评估强调对政策制定的合理性、政策执行的效率性、政策结果的效益性、公平性和可持续性进行客观测量和评判,政策各个阶段的评估相对独立,缺少对政策干预与政策效果之间关系的归因分析。政策评估应引入理论驱动评估的理念,理论驱动的评估理论和方法是陈惠次、彼得·罗希等人20世纪90年代针对以往评估研究过度重视方法和技术倾向而提出的。这一理论认为,评估应该建立在系统性的政策理论基础之上,深入了解政策的设计、政策执行过程中的因果关系和内在机制,在清晰地剖析政策设计的理论基础的基础上,引入因果推断的理念和方法,找到政策干预与效应的因果关系和因果机制,为循证决策创造科学依据。


——在政策评估指标中设置归因分析评分指标。在政策决策评价末级指标中设置政策逻辑的科学性和政策归因分析的科学性指标,评判决策是否建立在循证的基础上,是否进行归因分析以及分析的科学性如何。在政策效果评价指标中设置政策干预与政策效果的相关性,评判政策干预对政策效果的“净影响”程度。


——增强评估咨询机构的因果推断能力。评估机构要将因果推断技术和方法作为重要的政策评估方法引入评估服务中,加强因果推断评估方法的学习,提高数据分析能力,利用政策场景模拟、大数据分析、政策实验等新技术模拟随机实验和准实验情景,提高因果推断的能力。


——建立循证决策机制。在原有的达标考核、合规审计逻辑的基础上,综合运用绩效指标、政策分析等评估信息,建立政策干预与产出效果的自变量和因变量模型,融入因果推断的逻辑。强化循证决策理念,将因果推断的结果切实运用于政策调整、管理改善和预算安排等方面。

 (作者系中央财经大学教授)