品品科技|迎来TCN!股市预测任务是时候拥抱新技术了,告别RNN

编辑:魔王、陈萍
本文介绍了TCN在股市趋势预测任务中的应用 , 表明在集成新闻事件和知识图谱后 , TCN的性能大幅超过RNN 。
本文主要介绍了以下几部分内容:
1.金融时间序列(FTS)中的深度学习背景介绍;
2.值得关注的FTS数据处理实践;
3.时间卷积网络(TCN);
4.时间卷积网络在FTS中的应用实例;
5.基于TCN的知识驱动股市趋势预测与解释 。
1.背景介绍
金融时间序列(FTS)建模历史悠久 , 20世纪70年代初它首次革新了算法交易 。 FTS分析包括两类:基础分析和技术分析 。 但这两种分析方法都受到有效市场假说(EMH)的质疑 。
自1970年提出以来 , EMH一直备受争议 , 它假设股价最终是不可预测的 。 但这并没有限制如下研究:通过使用线性、非线性和基于ML的模型进行FTS建模 。
由于金融时间序列具有非平稳、非线性、高噪声的特点 , 因此传统的统计模型很难准确地预测它们 。 近年来 , 越来越多的研究开始尝试将深度学习应用于股市预测 , 虽然还远远不够完善 。 例如:
2013年
Lin等人在论文《AnSVM-basedapproachforstockmarkettrendprediction》中提出一种基于支持向量机的股票预测方法 , 建立两部分特征选择和预测模型 , 并证明该方法比传统方法具有更好的泛化能力 。
2014年
Wanjawa等人在论文《ANNModeltoPredictStockPricesatStockExchangeMarkets》中 , 提出一种利用误差反向传播的前馈多层感知机来预测股票价格的神经网络 。 结果表明 , 该模型能够对典型的股票市场进行预测 。
2017年
进入LSTM时代:使用LSTM网络处理时间序列数据的研究激增 。
Zhao等人在论文《Time-WeightedLSTMModelwithRedefinedLabelingforStockTrendPrediction》中提出向LSTM中加入时间加权函数 , 其结果优于其他模型 。
2018年
Zhang等人在文章《Forecastingstockpriceswithlong-shorttermmemoryneuralnetworkbasedonattentionmechanism》中结合了卷积神经网络(CNN)和循环神经网络(RNN) , 提出了一种新的架构——深度广域神经网络(DWNN) 。 结果表明 , 与常规RNN模型相比 , DWNN模型可以将预测均方误差降低30% 。
Ha等人在《Forecastingthevolatilityofstockpriceindex:AhybridmodelintegratingLSTMwithmultipleGARCH-typemodels》中提出将CNN用于定量股票选择策略 , 以确定股市趋势 , 然后使用LSTM预测股票价格 , 并提出一种混合神经网络模型 , 用于定量择时策略 , 以增加利润 。
Jiang等人在《StockPriceForecastBasedonLSTMNeuralNetwork》中利用LSTM神经网络和RNN来构建模型 , 发现LSTM可以更好地应用于股票预测 。
2019年
在论文《StockclosingpricepredictionbasedonsentimentanalysisandLSTM》中 , Jin等人在模型分析中增加了投资者的情感倾向 , 并引入经验模态分解(EMD)与LSTM相结合 , 以获得更准确的股票预测 。 基于注意力机制的LSTM模型在语音和图像识别中很常见 , 但在金融领域却很少使用 。
Radford等人提出GPT-2 , 旨在设计一个多任务学习器 。 它将预训练与监督微调结合起来 , 以实现更加灵活的迁移方式 。 GPT-2具有15亿参数 。
在《Knowledge-DrivenStockTrendPredictionandExplanationviaTemporalConvolutionalNetwork》中 , Shumin等人提出一种基于时间卷积网络的知识驱动方法(KDTCN) , 来进行股票趋势预测与解释 。
他们首先从财经新闻中提取结构化事件 , 并利用知识图谱获取事件嵌入 。 然后 , 将事件嵌入和股票价格结合起来预测股票走势 。 实验表明 , 该方法对股市趋势突变情况具有更快的反应能力 , 在股票数据集上的性能优于SOTA方法(本文将重点介绍这一方法) 。
2020年
2020年 , Jiayu等人和Thomas等人提出一类混合注意力网络 , 可基于近期新闻预测股票趋势 。 具有注意机制的LSTM优于常规LSTM , 因为其独特的存储单元结构避免了长期依赖性 。