新闻动态
新闻动态
2025年5月18日下午,由劳动人事学院劳动经济学系主办的“计量经济学与机器学习”小型培训课程在立德楼501教室顺利举行。来自弗吉尼亚理工大学的王乐教授分享了主题为“Causality & Machine Learning/AI”的相关内容。劳动人事学院院长赵忠教授、葛玉好副教授、翁茜副教授、邹先强副教授、陈轩副教授,以及其他校内外师生参与了此次培训课程。
王乐教授首先介绍了机器学习与传统计量经济学方法的差异。他指出引入机器学习方法在处理高维度数据、非线性和复杂函数关系、复杂数据结构、多重数据类型方面的必要性和优势。传统计量经济学以经济理论为基础构建计量模型,挖掘潜在数据结构的因果关系,追求估计量的一致性和大样本分布性质。而机器学习算法以数据为导向,追求样本外的预测精度,需要进行模型验证和交叉验证。随后他介绍了特征、训练集、测试集、过度拟合、正则化、交叉验证等机器学习算法中的基础概念。
其次他以基础的统计学思想、计量经济学理论为引导,具体讲解了三大类机器学习方法。首先,基于将连续变量离散化的思想,他介绍了回归树算法,及其具体步骤和相应R程序操做。他从样本均值的方差的角度启发大家思考集成学习算法的基本理念,进而介绍了随机森林算法。其次,基于多项式近似的思想,他从加权平均的角度介绍了非参数机器学习算法,其核心在于权重的选取。最后,他介绍了基于回归方程的正则化和收缩法,包括套索回归和岭回归,同时指出套索回归系数具有的稀疏特性,即通过将部分变量的系数估计为零,达到降低变量维度的作用。
最后,王乐教授介绍了如何将机器学习算法引入到计量经济学的因果推断领域。首先,他以自己的研究为例,指出聚焦于权重的选取,合成控制法可以看成是一种适应性套索回归。他的研究借助套索回归的方法,以小权重选取多个控制组,改善传统合成控制法中选取控制组较少,容易受冲击影响、降低估计准确性的问题。其次,基于弗里施沃定理的基本思想,他介绍了基于条件独立假设的双套索回归和双重机器学习方法及其应用条件。
在课程中,参会师生就经济研究中的理论驱动和数据驱动、如何平衡模型中的方差和偏差、基于深度学习方法的深度工具变量法,以及双重套索方法的原理和使用等问题进行了探讨。最后,赵忠院长代表参会师生对王乐老师的精彩分享表示由衷感谢。
(图文作者:杨益州 陈轩 审核人:陈轩)