主办单位:广东时代传媒有限公司
投稿邮箱:fzggzzs@163.com
主管单位:南方出版传媒股份有限公司
主办单位:广东时代传媒有限公司
出版周期:半月刊
编辑出版:发展改革理论与实践杂志社
国内刊号:CN 44-1729/F
国际刊号:ISSN 1003-6709
邮发代号:46-123
开本:16开
语种:中文
投稿邮箱: fzggzzs@163.com
胡邦凤
摘 要 本文构建了一种基于灰色长短时记忆网络的财政收入预测模型,巧妙的提取影响财政收入的各类因子的特征。一方面该模型使用灰色关联度提取主要影响因子,另一方面采用LSTM循环神经网络训练主要影响因子,最后使用该模型预测了某地区下一年的财政总收入。仿真实验表明,在某地区近十几年财政预测问题上,与简单的单因子循环神经网络或传统的多因子循环网络相比,该网络的预测精度更高,且模型加快了对数据的处理速度,实验证明该方法是一种有效的财政收入预测方法。
关键词 灰色关联度 循环神经网络 LSTM 财政预测
中图分类号:F222 文献标识码:A
0引言
随着中国经济的快速增长和金融市场的迅速发展,越来越多的投资者关注于提高财政预测的准确性,希望不断提高投资回报的同时有效地避免一定程度上的风险。对金融数据的分析和预测成为越来越热门的行业之一。
传统的研究方向主要是将统计学和概率论的方法应用于时间序列的预测模型,例如,灰色GM(1,1)预测,多元线性回归模型预测等。这些传统的预测方法往往假设的条件较多,一般只能找出数据与其相关影响因子之间的线性关系,而不能更好的反映数据之间的非线性关系,因此预测精度较低,相关应用也比较局限。
近年来,随着人工智能领域的飞速发展,越来越多的投资者开始尝试利用神经网络对财政进行模型分析和预测,同时也得到了良好的预测结果。刘仁涛、付强两位学者在2008年建立了基于BP神经网络的预测模型,利用人工神经网络在不确定性领域的优势,降低了传统模型中存在的系统误差,提高了预测精度。文献[3]建立了RBF神经网络财政收入预测模型,充分利用该网络快速的学习训练速度及其强大的拟合能力,为有效且精确地解决财政收入问题提供了新的研究方向。
本文针对广州市近十几年的财政数据做预测实验,对影响财政总收入的各个财政因子采用灰色关联度提取主要影响因子,再标准化处理主要影响因子作为LSTM神经网络的输入向量,然后使用LSTM结构预测财政总收入,最终再与其他模型对比,验证模型的有效性。
1灰色关联度
灰色关联度分析是灰色理论的重要组成部分,也是灰色系统分析、预测和决策的基石。灰色关联度算法通过计算参考数列和若干比较数列的几何相似程度来分析比较数列与参考数列间的关联程度,定量地描述系统的发展趋势,并根据因素之间的关联程度来分析事物的同步性。
灰色关联度分为绝对关联度和相对关联度。 绝对关联度采取初始点零化法进行初值化计算,当计算的因素观测值差异性较大时,使得变量之间的量纲不一致,对数据分析影响较大,难以得出合理的效果。 相对关联度采取相对量进行数据分析,使数据归一化处理,且计算结果与相对于初始点的变化速率有关,与各观测数据观测值无关,故能够准确的描述因素之间的关联程度。由于本文各财务收入数据量纲不统一,且各因素数据差异较大,故采用相对关联度来反映某地区地方财务总收入与其他财务收入的关联程度。
2 LSTM循环神经网络结构
循环神经网络(RNN)源自于1982年由Saratha Sathasivam提出的霍普菲尔德网络。循环神经网络的主要用途是处理和预测序列数据。循环神经网络会对每一时刻的输入结合当前模型状态给出一个输出,可高效提取序列数据的时序特征。循环神经网络理论上可以被看做是同一神经网络结构被无限复制的结果,但出于优化的考虑,目前循环神经网络还无法做到真正的无限循环,现实中一般会将循环体展开。循环神经网络是专门用于研究类似于时间序列数据等序列型数据的神经网络,并且大多数的循环神经网络也能够处理不同长度的时间序列数据。循环神经网络语言模型能解决传统N-gram模型中存在的数据稀疏和维数灾难问题,但仍缺乏对长距离信息的描述能力。
LSTM结构是由Sepp Hochreiter和Jurgen Schmidhuber于1997年提出的,它是一种特殊的循环体结构,与单一循环体结构不同,LSTM是一种拥有三个“门”结构的特殊网络结构,输入门、遗忘门和输出门,靠这些“门”的结构让信息有选择性地影响循环神经网络中每个时刻的状态。在前向传播中,输入门控制输入到记忆细胞的信息,输出门控制记忆细胞到网络其他结构单元的信息;在后向传播中,输入门控制误差流出记忆细胞,输出门控制误差流入记忆细胞。遗忘门控制记忆细胞内部的循环状态,决定哪些信息应该被遗忘,哪些信息应该得到保留。LSTM将RNN的输入层、隐藏层移入记忆单元加以控制,并通过“门”结构来去除或者增加信息,一般采用sigmoid或tanh函数进行描述。LSTM通过构建内存单元对序列信息进行建模,有效的解决了标准RNN的梯度消失和梯度爆炸问题。
3案例分析
3.1数据源与数据预处理
本文模型所用到的财政数据均来自广州市统计年鉴。提取1999年到2016年的历史财政数据,分析模型吻合度。由于提取的数据存在少量影响因子数据缺失,故首先对历史数据预处理。部分缺失年份的数据采用灰色GM(1,1)模型或拉格朗日线性插值补充,严重缺失年份的数据则不考虑影响指标。经过处理后,最终得到20个完整的财政因子数据。由于存在单位不统一与数量级不同问题,因此先对数据进行无量纲化预处理,对预处理后的财政数据采用灰色关联度模型计算影响广州市财政总收入的主要影响指标,计算结果如表1所示。
提取关联度值大于等于p=0.5的影响因子作为主要影响因子,除去城市维护建设税、车船税和其他收入影响指标,共16个主要影响因子,获得历史财政序列数据17*18矩阵。将标准化的主要影响因子全部数据作为LSTM神经网络的输入数据训练模型,并预测2017年的广州市财政总收入。
3.2参数设置和预测结果分析
本文在Matlab和TensorFlow平台建立、训练和实现模型。为验证和说明LSTM网络的预测性能,采用全连接神经网络(ANN)和BP神经网络2种经典的人工智能算法与长短时记忆网络(LSTM)模型对比。三种神经网络的输入、输出层节点个数一致,全连接神经网络(ANN)隐含层为2层,2层隐含层节点数均为10个;BP神经网络隐含层为1层,节点数为10个;长短时记忆网络(LSTM)和1层隐藏层全连接,节点数为10个;三种神经网絡均采用ReLU函数作为神经网络的激活函数,使用梯度下降法进行网络训练。
对于财政数据而言,LSTM模型其输入层可以是固定长度的历史数据序列,也可以是影响财政价格序列的其他因子。当输入层是一个固定长度的财政指标时,可以采用单因子的LSTM模型对财政数据建模。当LSTM模型输入层是包含影响财政总收入的N个固定长度的历史年份数据,就可以使用多因子的LSTM模型对财政总收入预测,此时输入层是一个N*T的财政历史价格矩阵。模型的预测结果如图1所示。
为了进一步分析预测效果,本文采用平均绝对误差MAE(Mean Absolute Error)、均方根误差RMSE(Root Mean Square Error)和平方绝对百分比误差MAPE(Mean Absoulte Percentage Error)三种误差方法为评价指标,对模型的进行估计。MAE、RMSE和MAPE点的计算公示如下:
(5)
其中为财政数据的实际值,单位为万元;为财政预测值,单位为万元,N为财政数据总数。
全连接神经网络(ANN)、BP神经网络与长短时记忆网络(LSTM)三种模型的上述指标的计算结果如表2所示。
由表2可知,采用长短时记忆网络(LSTM)的预测模型的误差性能明显优于全连接神经网络(ANN)和BP神经网络模型。而全连接神网络(ANN)的预测模型误差性能显著优于BP神经网络模型,由此可知,采用长短时记忆网络(LSTM)模型在时间序列预测中的效果显著,精度相对较高。
4总结
利用广州市1999-2016年财政数据建立基于LSTM结构的多因子循环神经网络,与全连接神经网络模型和BP神经网络模型相比,对财政总收入的预测精度更高,又有较低的时间复杂度,有效的防止了传统RNN模型中的梯度消失和梯度爆炸问题。但由于LSTM模型初始化权重和偏置项都是随机的,故模型结构较为复杂,需要消耗大量的时间。该模型具有一定的可行性。
参考文献
[1] 史雪荣,王作雷.GM(1,1)模型参数的神经网络算法[J].数学的实践与认识,2006,36(04).
[2] 刘仁涛,付强,冯艳.基于RAGA 的灰色BP神经网络预测模型及其对三江平原地下水埋深的动态预测[J].系统工程理论与实践,2008,5(05).
[3] 赵海华.基于灰色RBF神经网络的多因素财政收入预测模型[J].方法应用,2016(13).
[4] 郑泽宇,顾思宇.Tensorflow实现Google深度学习框架[M].北京:电子工业出版社,2017:199-227.
[5] Busseti,E.&I.Osband&S.Wong. Deep learning for time series modeling[D].Technical report, Stanford University, 2012.
[6] 师彪,李郁侠,于新花,闫旺,李娜,孟欣,李鹏.弹性自适应人工鱼群-BP神经网络模型及在短期电价预测中的应用[J].水力发电学报,2010,29(01).
[7] Hochreiter,S.&J.Schmidhuber, LSTM can solve hard long time lag problems[J].Advances in Neural Information Processing Systems,1996(01).
[8] 赵明,杜会芳,董翠翠.基于word2vec和LSTM的饮食健康文本分类研究[J].农业机械学报,2017,48(10):1000-1298.
[9] 阳珊,樊博,谢磊.基于BLSTM-RNN的语音驱动逼真面部动画合成[J].清华大学学报,2017,57(03):250-256.
[10] 朱乔木,李弘毅.基于长短记忆网络的风电场发电功率超短期预测[J].電网技术,2017,41(12).