2020年 第12期 (总第65期)
吴辉航 魏行空 张晓燕
(鑫苑房地产金融科技研究中心)
【摘要】股票收益率的可预测性一直以来都是金融学的核心研究问题之一,本文尝试引入机器学习的方法来探索收益率可预测问题在中国的答案。基于1997年1月到2019年12月A股市场的108个股票异象性特征,本文比较了传统计量经济学模型与最小偏二乘回归、主成分回归、弹性网络回归、随机森林、梯度提升树和神经网络模型6大主流机器学习算法在A股个股样本外可预测性问题上的表现。研究主要发现有三点:(1)历史交易数据信息对下个月个股股票收益率依然有预测效果,且机器学习算法的样本外预测效果优于传统计量经济学模型。(2)在中国A股市场上,流动性类特征变量的预测能力较强,而动量类特征较弱。(3)机器学习算法与资产定价研究结合有显著的经济意义,两层神经网络等权重(市值加权)多空策略资产组合的绩效表现在所有模型中表现最好,在样本外测试期内平均能获得3.03%(2.94%)的月度收益,月度波动率为4.65%(6.88%),年化夏普比率为2.26(1.48),经过FF5因子调整后的依然能获得显著的月度Alpha值为3.03(2.95)。
总第65期 金融科技研究报告2020-12:机器学习视角下中国股票资产收益率可预测性研究