时序模型初探之三:指数平均法

简述

一般而言,历史数据对未来值的影响是随着时间地推移而递减的。所以,不同于移动平均法只关注时间序列中近期数据对预测值的影响,指数平滑法对时间序列中所有的观测值依时间顺序进行加权平均作为预测值的作法,显得更切合实际。

三种常用预测模型

指数平滑法(Exponential Smoothing,ES),本质上是一种加权平均法,由于其加权系数符合指数规律,又具有平滑数据的功能,故称之为指数平滑法。

指数平滑法根据平滑次数的不同,可分为三种常用的预测模型,分别是:

  • 一次指数平滑法

    • 预测模型

      设时间序列为,加权系数为,一次指数平滑公式为:

      为进一步理解指数平滑的实质,将上式依次展开,可得:

      由上式可知,是对全部历史数据的加权平均值,加权系数分别是,其预测模型为:

    • 加权系数的选择

      在指数平滑预测模型中,加权系数的选择决定了最终的预测结果。的值决定了在做新预测时新数据和原预测值所占的权重。值越大,新数据所占的权重越大,原始预测值所占的权重就越小,反之亦然。

      由式(3)可知,新预测值本质上是使用预测误差对原预测值进行修正后得到的,其中的值与修正的幅度成正比:

      1. 如果,则,新预测值等于原预测值,即忽略新观测值,完全相信过去信息。
      2. 如果,则,新预测值等于新观察值,即忽略过去信息,完全相信新观测值。

      因此,的值应根据时间序列的具体性质在0~1之间选择。一般原则是:

      1. 如果时间序列波动不大,则的值应取小一点,e.g. 0.1~0.5之间
      2. 如果时间序列具有迅速且明显的变动倾向,则的值应取大一点,e.g. 0.6~0.8之间。这样预测模型更为灵敏,以便迅速响应变化。

      实际应用上,类似移动平均法,多取几个值,选其中预测误测最小的那个。

    • 初始值的选择

      在指数平滑预测模型中,除了选择合适的值,还要确定初始值。初始值是由预测根据经验指定的。一般原则是:

      1. 如果时间序列的观测数据较多,初始值对以后的预测值影响很小,可选用第一期的观测值作为初始值。
      2. 如果时间序列的观测数据较少,初始值对以后的预测值影响较大,可选用最初几期观测值的平均值作为初始值。
  • 二次指数平滑法

    一次指数平滑法适用于时间序列没有明显变动趋势的场景。但是当时间序列的变动出现线性变动趋势时,用一次指数平滑法进行预测的未来值会存在明显的滞后偏差,而线性趋势恰好体现在滞后偏差上。因此,二次指数平滑的思想是:一次指数平滑法得到的滞后偏差建立线性趋势模型。对一次指数平滑模型的预测结果进行修正,即进行二次移动平均,最终得到修正后预测值更接近实际情况。

    • 预测模型

      根据一次指数平滑法的计算公式:

      可得二次指数平滑法的计算公式为:

      其中,为一次指数的平滑值,为二次指数的平滑值。

      设时间序列从某个时期开始呈现线性趋势,且线性趋势会延续到未来,其线性趋势预测模型为:

      其中,表示当前时期,为由至预测期的间隔期数,为平滑系数,分表示斜率和截距。

      类似二次移动平均法的线性趋势模型推导过程,可得二次指数平滑的线性趋势模型:

      总结,二次指数平滑法一种既能反映趋势变化,又可以有效的分离出周期变动的预测方法。因此,适用于同时存在线性趋势和周期波动的时间序列

  • 三次指数平滑法

    当时间序列的变动表现为二次曲线趋势时,则需要使用三次指数平滑法

    当时间序列的变动表现为二次曲线趋势时,则需要用三次指数平滑法。三次指数平滑法是在二次指数平滑的基础上,在进行一次平滑。其计算公式为:

    其中,分别为一次指数平滑值,二次指数平滑值和三次指数平滑值。

    设时间序列从某个时期开始呈现二次曲线趋势,且变动趋势会延续到未来,其二次曲线趋势预测模型为:

    其中,表示当前时期,为由至预测期的间隔期数,为平滑系数。

    三次指数平滑法的预测模型为:

总结

指数平滑预测模型是以时刻为起点,综合历史序列的信息对未来进行预测。选择合适的加权系数是提高预测精度的关键。一般的原则是:

  1. 如果序列的基本趋势比较平稳,预测偏差由随机因素造成的,则的值应取小一点,以减少修正幅度,是预测模型能包含更多的历史数据。
  2. 如果预测模板的基本趋势已经发生系统地变化,则 的值应取大一点,这样可以偏重新观测值对原预测模型进行大幅度修正,使预测模型适应预测目标的新变化。

Comments