English
首页 研究成果 全部 正文

机器学习视角下的债券超额回报,区块链研究中心副主任施展相关论文被国际一流期刊接收


 近日,清华大学金融科技研究院区块链研究中心副主任施展及其合作者Jing-Zhi Huang(宾夕法尼亚州立大学)合著论文Machine-Learning-Based Return Predictors and the Spanning Controversy in Macro-Finance (《基于机器学习的回报预测因子与利率曲线的信息完备性之谜》)被国际一流学术期刊 Management Science(《管理科学》)正式接收,待刊发表。

利率债的超额回报是可预测的吗?已有文献发现,基于收益率曲线构造的变量(如远期利差等)具有对美国国债超额回报的预测能力。然而,对于收益率曲线是否具有信息完备性——收益率之外的因子(如宏观经济变量)能否对债券的预期超额收益具有额外的解释能力,文献中没有达成共识。过去实证文献中考虑的宏观变量通常是衡量实体经济增速和通货膨胀的标准变量。这些变量对债券风险溢价的直接预测能力很小,或者与收益率曲线高度相关,因此在控制了国债收益率因素后失去预测能力。

该论文提出一种可分隔正则化的机器学习算法(SAGLasso)并将其应用于包含131个宏观经济变量(以及它们的6期滞后)的面板数据来构建新的宏观变量,称为SAGLasso因子。

SAGLasso因子在控制了收益率因素后,对债券风险溢价具有很强的样本外预测能力。更为重要的是,SAGLasso因子的预测能力可以为投资者带来巨大的经济收益。

除了有强大的预测能力之外, SAGLasso因子还具有简约、直观和易于解读的特征。具体而言,它是从917个宏观经济变量中筛选出的30个变量的线性组合,与许多不具有经济意义的预测因子不同,SAGLasso因子选取的30个宏观经济变量可以归类为房地产、劳动力以及通货膨胀三个方面的经济因素。此外,SAGLasso因子与当期债券收益率的相关性极低,因此,它是一个“纯粹的”基于宏观指标的债券收益预测因子。

SAGLasso因子也为宏观金融文献中利率曲线的信息完备性之谜提供了一个潜在的解决方法。由于SAGLasso因子几乎不受当期收益率因素的影响,收益率因子在回归模型中无法吸收其预测能力;而动态期限结构模型的估计结果也表明,忽略宏观层面的因素会损失25%左右的关于未来债券回报的信息。

该论文有诸多创新之处:

首先,它是最早在债券市场上引入机器学习算法的文献之一(曾在2011年美国金融学会年会上宣讲)。该算法适用于从大量宏观变量中构造简约的回报预测因子。

其次,该论文构造了一个新的、易于解读的宏观预测因子,该因子对债券风险溢价具有很强的样本外条件预测能力。此外,与文献中常用的宏观变量不同,SAGLasso因子对债券超额收益的预测能力不会被收益率因素所吸收,而且在小样本分析中表现稳健。

第三,构造的SAGLasso因子可以在统一的框架下解决宏观金融文献中关于收益率曲线信息完备性的争议。