机器学习中的时间序列预测概述( 二 )


  1. 自回归:利用观测值和过去的滞后观测值之间的依赖关系建立的模型 。
  2. 综合:取原始观测值之间的差值(例如 , 在前一个时间步中将一个观测值减去另一个观测值) , 以使时间序列保持平稳 。
  3. 移动平均线:一种利用观测值和移动平均模型残差之间的相关性来进行滞后观测的模型 。
ARIMA(p,d,q)模型中:p是自回归(AR)的项数 , 用来获取自变量;d是差分(I)的系数 , 为了使时间序列平稳;q是移动平均(MA)的项数 , 为了使其光滑.
平稳序列
如果Y在时间t的分布与任何其他时间点相同 , 则称该序列为“严格平稳” 。 这意味着序列Yt的均值、方差和协方差是时间不变的 。
可以通过差分使非平稳序列平稳 。 一般说来 , 如果微分d次是平稳的序列 , 则称其为d阶积分 。
ARIMA模型中的“ I”代表integrated 。 它是衡量实现平稳性需要多少非季节的度量 , 也是ARMA和ARIMA之间区别的基础 。
为什么我们需要假设序列平稳呢?
  1. 如果该系列是非平稳的 , 则标准技术无效 。
  2. 如果序列是非平稳的 , 则可能导致自相关 。
  3. 可能会导致虚假的回归 , 表明与过去的值存在关系 , 而实际上不存在这种关系 。