ARMA 模型是根据时间序列本身的数字特征,来寻找变量当期值与其若干滞后期值及误差项之间的关系,并在此基础上对后期数据进行预测,是时间序列分析的常用模型。由于ARMA 模型是以AR (自回归)模型和MA (滑动平均)模型为基础“混合”构成的,所以它的阶是二维的(p,q)。
AMRA模型使用的基本原理:将预测指标随时间推移而形成的数据序列看作是一个随机序列,这组随机变量所具有的依存关系体现着原始数据在时间上的延续性。一方面,受到其它因素的影响,另一方面,又有自身变动规律,假定影响因素为x1,x2,…,xk,1为各个因素所占的权重,由回归分析,
,2,...p
其中Y是预测对象的观测值,Z为误差。作为预测对象Yt受到自身变化的影响,其规律可由下式体现,
误差项在不同时期具有依存关系,由下式表示,
由此,获得ARMA模型表达式:
其中p 代表自回归成分的阶数,q 代表移动平均成分的阶数, 记做ARMA(p,q),
即时间序列是由它的前p 期值及当前和前q 期的随机误差项的线性函数,εt 是随机干扰误差项。
具体模型的建立:
1.数据来源及处理
我们选取余额宝每日万份收益作为收益率的衡量指标。由于货币式基金的每份单位净值固定为1 元,万份收益就是指把货币基金每天运作的收益平均摊到每一份额上,然后以1 万份为标准进行衡量和比较的一个数据。通俗地说就是投资1 万元当日获利的金额,即具体每天计入投资人账户中的实际收益。数据跨度为2013 年10月10 日至2014 年10 月10 日,共365个样本,记做rewards1,数据来源于天弘基金官方网站。为了消除数据中可能存在的异方差性,同时也为了避免数据变化所带来的剧烈波动,对其进行了对数变化,记为lnrewards1。本文使用Eviews软件对对时间序列进行统计分析,观察数据的变化情况。
2.数据的平稳性分析及检验
对时间序列进行平稳性的判断是预测的首要步骤。一般而言,所谓的平稳时间序列是指宽平稳过程,即是一阶距与时间无关,二阶距只与时间间隔有关。有几种判断方法:
1)数据图直接检验法。画出X(t)的图像,当x(t)围绕某一水平线上下波动而无明显上升、下降或周期趋势时,则认为x(t)是平稳的。
2)自相关、偏相关函数检验法。一个零均值平稳序列的自相关函数和偏自相关函数要
么是截尾的,要么是拖尾的。因此,如果一个序列零均值化以后的自相关函数或偏自相关函数既不截尾,又不拖尾则可以断定该序列时非平稳的。(我们采用的方法)
3)特征根检验法。先拟合序列的适应模型,然后求由适应模型的参数组成的特征方程的特征根,若所有的特征根都满足平稳性条件,abs(namta)<1则可认为该序列时平稳的,否则该序列是非平稳的。其中namta为特征根。
4)Rk检验。根据Green函数Gj与自协方差函数Rk之间的关系,当{xt}是平稳时间序列时,Gj的极限趋于0,表示稳定系统的单位脉冲响应最终将衰减至0。
采用Eviews软件对数据进行操作,序列lnrewards1进行ADF平稳性检验,ADF值跟设定的3个临界值相对比,判断其为非平稳性序列之后,可对序列进行差分(可作出趋势图),作平稳化处理,多次检验和处理直到数据比较理想。
3.模型定阶
利用 Box 和Jenkins提出的,通过获得样本自相关系数和偏自相关系数确定序列类型。不同阶数AIC与SC评价指标比较最终可确定模型阶数p,q。在一般的情况下,AIC可以表示为:
AIC=2k-2ln(L)
其中:k是参数的数量,L是似然函数。
假设条件是模型的误差服从独立正态分布。
让n为观察数,RSS为剩余平方和,那么AIC变为:
AIC=2k+nln(RSS/n)
增加自由参数的数目提高了拟合的优良性,AIC鼓励数据拟合的优良性但是尽量避免出现过度拟合的情况。所以优先考虑的模型应是AIC值最小的那一个。赤池信息(AIC)准则的方法是寻找可以最好地解释数据但包含最少自由参数的模型。
4.模型的可逆性和平稳性检验,AMRA(p,q)的预测及分析
因篇幅问题不能全部显示,请点此查看更多更全内容