品品科技|迎来TCN!股市预测任务是时候拥抱新技术了,告别RNN( 五 )
基线:
文章图片
使用不同输入的基线模型 。 第一列中 , 前缀WB表示词嵌入 , EB表示事件嵌入 , PV表示股价向量 , KD表示知识驱动 。 注意 , eventembedding^(a)和eventembedding^(b)分别表示不具备/具备KG的事件嵌入 。
4.3预测评估
KDTCN的性能评估基于以下三个方面:1)基础TCN架构的评估;2)不同模型输入对TCN的影响;3)基于TCN的模型对股市趋势突变的预测性能 。
基础TCN架构:
文章图片
在道琼斯工业平均指数数据集上 , 不同基础预测模型的股市趋势预测结果 。
TCN在股市趋势预测任务上超过其他基线模型 , 不管是传统的机器学习模型(ARIMA)还是深度神经网络(如LSTM和CNN) , 这说明TCN在序列建模和分类问题上有更明显的优势 。
不同模型输入:
文章图片
在道琼斯工业平均指数数据集上 , 不同输入的TCN模型的股市趋势预测结果 。
可以看出 , WB-TCN和EB-TCN的性能都超过TCN , 这表明文本信息有助于改进预测结果 。
KDTCN获得了最高的准确率和F1得分 , 这说明模型输入集成结构化知识、金融新闻和股价信息是有效的 。
模型对股市趋势突变的预测性能:
文章图片
基于局部道琼斯工业平均指数数据集(股市趋势突变) , 不同输入的模型的股市趋势预测结果 。
可以看出 , 使用知识驱动事件嵌入输入的模型(如KDEB-TCN和KDTCN)性能大大超过基于数值数据和文本数据的模型 。 这些对比结果说明 , 知识驱动的模型对于股市突变能够做出更快的反应 。
那么 , 如何量化股市波动程度呢?
首先 , 通过识别两个邻近股票交易日的波动程度D_(fluctuation)获取股市突变的时间间隔:
文章图片
其中时间t处的x表示股票交易日t的股票价格 。 波动程度的差异C被定义为:
文章图片
如果|Ci|超过特定阈值 , 则可以认为在第i天 , 股票价格突变 。
4.4解释预测结果
为什么知识驱动事件是不具备ML专业知识的人识别股市突变的常规来源?这可以从两个方面进行解释:1)将知识驱动事件对突变预测结果的影响可视化;2)将知识驱动事件链接至外部KG , 进而检索事件的背景事实 。
将知识驱动事件的影响可视化:
下图中的预测结果显示道琼斯工业平均指数趋势将下降 。 注意图中同色长条表示相同的事件影响 , 长条的高度反映了影响的程度 , 事件的流行性自左向右下降 。 直观来看 , 具备更高流行性的事件对股市趋势突变预测应有更大的影响 , 但事实并不总是如此 。
文章图片
事件对股市趋势预测的影响示例 。
几乎所有负影响事件都与这两个事件有关 , 如(BritishPound,drops,nearly5%)和(NorthernIreland,callsforpollonUnitedIreland) 。
尽管一些事件对预测股市趋势上涨有着积极影响也具备高流行性 , 但整体影响仍是负面的 。 因此 , 股票指数波动出现突变可被视为事件影响和事件流行性的共同结果 。
事件元组链接至KG后的可视化结果:
- 七号人称说科技|华为始料未及?台积电又成了“炮灰”?新风暴说来就来
- 大众新闻|众安科技荣获“今日·保险中介榜”年度Insurtech独角兽
- 雷科技|朋友圈都在秀的“互联网勋章”到底是什么?
- 快科技|小米10至尊纪念版妙享功能升级:手机与Windows电脑合体
- 七号人称说科技|再给华为一颗糖?美国到底在打什么“算盘”?,先给华为一巴掌
- 小米科技|小米旗舰再“搅局”!144Hz+2K+百倍变焦,5纳米性能赶超A14
- 科技小乐乐|12:你想太多了,跌至4784元?全网刷屏的琼版iPhone
- 雷科技|12直降1500,海南版真有这么香?,iPhone
- 科技小乐乐|为什么国内有人已拿到iPhone12却不敢开机?
- 浪浪科技|亚马逊42%的评论为虚假评论,报告:疫情期间