基于改进自然选择粒子群算法的铁路客运量组合预测研究

时间:2023-10-17 14:44:04 来源:网友投稿

杨 飞 王 洋

(中铁工程设计咨询集团有限公司, 北京 100055)

随着旅客出行需求和运输服务水平的不断提高,我国旅客运输市场竞争越发激烈。合理准确的铁路客运量预测可为制定铁路客运宏观发展战略和编制客运计划提供依据,也可为铁路管理者合理分配资源、提高运输市场竞争力提供重要依据。

近年来,为提高铁路客运量的预测精度,较多学者通过组合预测的方法对铁路客运量预测结果进行改进。众多组合预测过程中,权重取值方法成为较多学者研究的重点。游文倩[1]通过最优权重法对组合预测模型的权重进行赋值,并将其应用于GDO组合预测领域中;
刘春红[2]从最优权重和残差优化角度对单一预测模型权重进行赋值,进一步预测了猪舍氨气浓度;
王秀梅[3]基于误差平方和最优的思想将偏最小二乘法、ARIMA模型和指数平滑法预测结果进行组合,对农产品冷链物流需求进行预测;
褚鹏宇[4]采用广义回归神经网络对预测模型的权重进行赋值,建立了变权重组合的灰色预测模型;
苏丽敏[5]以误差平方和最小为目标函数,结合最大熵原理构建了变权组合预测模型;
李佩[6]以平均误差最优为目标来给组合预测权重赋值;
周宏[7]用最小二乘原理对ARIMA和SARIMA模型的权重进行分配,并将其用于高速公路短时交通流预测。

目前,在铁路客运量组合预测研究领域中,权重赋值方法存在计算量大、组合预测精度不佳等缺点。而群体智能算法因其精度高、应用广泛等优点,已成为解决优化问题的热门算法,但群体智能算法也存在陷入局部最优等问题。因此,本文基于自然选择的粒子群算法,对其权重和学习因子进行改进,应用改进基于自然选择的粒子群算法求解ARIMA模型和BP神经网络预测的铁路客运量的权重,对铁路客运量进行组合预测。

假设运用m种模型对某一研究区域的铁路客运量进行预测,则组合预测模型的计算公式为:

式中:Q——铁路客运量组合预测值;

wi——第i个预测模型的权重,且

qi——第i个模型的预测值;

m——预测模型的数量。

预测方法的选择是影响铁路客运量预测精度的关键,本文选择ARIMA模型和BP神经网络作为时间序列预测和非线性预测模型的代表进行组合预测研究。

(1)ARIMA模型

ARIMA(p,d,q)模型的一般形式为:

at——零均值且方差同为σa2的白噪声;

p——自回归阶数;

q——移动平均阶数;

d——差分阶数。

(2)BP神经网络

BP神经网络拓扑结构如图1所示,其基本思想是梯度下降法,学习过程包括正向传播和反向传播。正向传播过程中,将铁路客运量及其影响因素等信息经输入层传至隐含层,最后传至输出层。判断输出的值与实际值的误差精确度,若输出值误差不理想,将误差按照输出层 - 隐含层 - 输入层进行反向传播,通过反复训练和比较使误差最小。

图1 BP神经网络拓扑结构图

2.1 基于自然选择的粒子群算法基本原理

基本粒子群算法(PSO)中,假设第i个粒子在第t次迭代的位置和速度分别是 xi,t和 vi,t,粒子通过监督个体和种群极值来更新位置和速度,进一步逼近最优解[8],其更新公式为:

式中:w——权重,取0.4~0.9;

c1和c2——学习因子,取值范围均为0~4;

rand——生成0~1之间的随机数;

pbest——个体极值;

gbest——群体极值;

λ——速度系数,一般取1。

基于自然选择的粒子群算法是基于基本粒子群算法,其基本思想是在每次迭代中,根据计算的适应度值用群体中较好的一半粒子替换较差的一半粒子,且保留粒子记忆的历史最优值。

2.2 改进基于自然选择的粒子群算法

基本的基于自然选择的粒子群算法一般采用固定权重和学习因子的方法来寻求最优解,权重一般取0.4~0.9,学习因子一般取2。粒子群算法具有较好的鲁棒性,一般情况下权重和学习因子取经验值即能满足精度要求。然而,当仿真环境更复杂或对优化精度有更高要求时,权重和学习因子取值对求解精度和速度有一定的影响。因此,本文基于对数函数和正弦函数非线性变化的思想来优化基于自然选择粒子群算法的权重和学习因子取值,从而提高算法的寻优能力。

权重优化原理为:初始迭代时,为保证基于自然选择粒子群算法的全局搜索能力,赋予权重较大的值。为保证该算法能寻找到最优解,迭代过程中逐渐减小权重取值。基于对数函数在其定义域大于等于1时非线性变化的特点,权重w优化为:

式中:wmax——权重最大值;

wmin——权重最小值;

权重取值规律如图2所示。

由图2可知,当迭代次数为0时,权重取到最大经验值,且下降的加速度较大,基于自然选择的粒子群算法在迭代初期的全局搜索能力变强。随着迭代次数的增加,以对数函数非线性变化的规律逐渐赋予权重越来越小的值,且权重下降的加速度越来越小,能保证迭代末期在可行域范围内更细致地寻找最优解。

图2 权重非线性变化趋势图

学习因子优化原理为:随着迭代次数的增加,c1最佳取值范围为2.5~0.5间递减,c2最佳取值范围为0.5~2.5之间递增[9]。在最优取值范围内,为保证迭代初期的全局搜索能力,使初始时个体粒子自身学习能力较大,让c1的取值随迭代次数的增加呈正弦函数非线性减少,同时让c2随迭代次数的增加逐渐增大,加强粒子在后期的群体学习能力。基于该思想,改进的学习因子为:

学习因子取值规律如图3所示。

图3 学习因子非线性变化趋势图

由图3可知,学习因子c1初期取到最大值2.5,且下降的加速度较大,初期搜索能力更强;
同时,让c2的取值逐渐增大,且加速度逐渐变小,加强了迭代后期的搜索精度。

2.3 改进基于自然选择的粒子群算法优化权重

改进基于自然选择的粒子群算法优化权重的过程如图4所示。

图4 改进基于自然选择的粒子群优化权重算法图

(1)根据所选单一预测模型预测铁路客运量。

(2)根据铁路客运量预测结果构建适应度函数。以组合预测精度最优为目标确定适应度函数,即所有预测年份的预测相对误差的绝对值最小。因此,适应度函数定义为:

式中:n——预测总年度;

Χt——第t期的客运量实际值。

(3)初始化种群粒子参数。根据粒子参数的取值范围等约束,设置初始的参数取值。

(4)计算粒子适应度。

(5)比较所有粒子适应度值,寻找到当前最优粒子适应度值及其位置,以此更新粒子的搜索位置和搜索速度。

(6)基于自然选择原理对粒子进行排序,用群体中最好的一半粒子替换最差的一半粒子。

(7)判断是否满足迭代终止条件。若满足,算法结束;
若不满足,返回第4步。

(8)输出最优解。

考虑指标获取的可操作性,选取具有代表性的地区生产总值、常住人口、人均消费水平、旅游人数、铁路运营里程等指标研究其对铁路客运量的影响[10],以北京市1996 - 2016年数据为训练样本,以2017 -2019年客运量为测试样本进行预测[11-12]。

3.1 单一模型的铁路客运量预测

3.1.1 BP神经网络预测

通过MATLAB编程实现BP神经网络的预测过程,主要参数设置为:训练次数为1 000次,隐藏层为1层,神经元设为1个。BP神经网络预测基本情况如图5和图6所示。

图5 BP神经网络预测收敛过程图

图6 BP神经网络预测结果图

由图5可知,网络训练3次后收敛,验证集网络误差为0.003 493 5,训练集和测试集的网络误差低于0.003 493 5,误差精度较好;
由图6可知,BP神经网络预测的拟合效果较好,2017 - 2019年平均预测相对误差为2.354%。

3.1.2 ARIMA模型预测

为兼顾预测模型的精确性和训练样本数据的完整性,借助于SPSS软件经过反复试验确定ARIMA模型的差分阶数d取0时,自回归阶数p取4,移动平均阶数 q取 1。因此,ARIMA(4,0,1)预测结果如图7所示。

图7 ARIMA(4,0,1)预测结果图

由图7 可知,1996 - 2016 年 ARIMA(4,0,1)预测的拟合效果非常好,但2017 - 2019年预测误差相对较差;
ARIMA(4,0,1)平均预测相对误差为- 5.43%,存在进一步优化的空间。

3.2 基于自然选择粒子群的铁路客运量组合预测

3.2.1 组合预测思路及仿真环境设置

选择BP神经网络和ARIMA(4,0,1)对铁路客运量进行组合预测,组合预测公式为:

式中:w1、w2——分别为 BP 神经网络和 ARIMA(4,0,1)模型预测权重;

qbp、qar——分别 BP 神经网络和 ARIMA(4,0,1)模型预测值;

Qz——BP神经网络和ARIMA(4,0,1)模型组合预测值。

由权重约束条件w1+ w2= 1,式(9)可简化为:

因此,改进基于自然选择的粒子群算法只需要求解w1即可。

本节算法实验在MATLAB环境下进行,编写改进基于自然选择的粒子群算法代码求出测试样本中组合预测误差绝对值最小的权重w1。

粒子群算法主要参数初始化有:种群规模为20个;
最大迭代次数为300次;
速度搜索区间为- 5~5。为进一步验证本文提出改进基于自然选择的粒子群算法的寻优能力和收敛速度,与基本粒子群算法和基于自然选择粒子群算法进行对比,学习率c1、c2均取 2,权重取 0.9。

3.2.2 改进自然选择粒子群算法优势分析

不同粒子群算法求解最优权重的适应度值随迭代次数的变化如图8所示。

图8 不同粒子群算法的寻优效果图

由图8可知,提出的改进基于自然选择的粒子群算法求解速度和精度更好[13-14],具体包括:

(1)基于自然选择的粒子群算法求解权重的适应度值是0.004 206 820 384 781,迭代至273代时开始收敛;
改进基于自然选择的粒子群算法求解权重的适应度值是0.004 206 805 448 164,迭代至182代开始收敛。改进基于自然选择的粒子群算法求解的适应度值精度能够提高0.000 000 014 936 617,迭代次数减少了91代,具有更好的寻优能力和收敛速度。

(2)基本粒子群算法求解权重的适应度值是0.004 206 910 498 023,在266次迭代后收敛。基于自然选择的粒子群算法也具有更好的寻优能力,其适应度值精度提高了0.000 000 090 113 242;
相比于基本粒子群算法,改进基于自然选择的粒子群算法的寻优能力和收敛速度都有较大的提升。

3.2.3 组合预测结果分析

改进基于自然选择的粒子群算法求解w1的情况如图9所示,在0~1之间求解得最优值为0.689,由此计算得w2为0.311。

图9 权重w1取值图

为进一步验证改进基于自然选择的粒子群算法求解权重的组合预测效果,将其与等分权重法赋值权重的组合预测效果进行比较(权重均取0.5)。不同预测方法测试样本的预测结果如表1所示。

由表1可知,改进基于自然选择的粒子群算法求解的权重具有更好的组合预测效果,具体体现在:

表1 不同预测方法的铁路客运量预测值表

(1)相比于单一预测模型,改进基于自然选择的粒子群算法求解权重的组合预测精度更高,2017 -2019年平均相对预测误差绝对值为0.420%,而BP神经网络和ARIMA模型的平均相对预测误差绝对值分别为2.354%和5.430%。

(2)相比于等分权重法,改进基于自然选择的粒子群算法求解权重的组合预测效果也更好;
等分权重法赋值权重后,2017 - 2019年平均预测相对误差绝对值为1.538%,比改进基于自然选择的粒子群算法求解权重的组合预测误差高1.118%。

本文引入基于自然选择的粒子群算法用以解决组合预测模型权重分配问题,通过非线性变化的特点对基于自然选择的粒子群算法的权重和学习因子改进,并将改进基于自然选择的粒子群算法用以求解BP神经网络和ARIMA模型组合预测的权重,得到主要结论有:

(1)改进基于自然选择的粒子群算法具有更好的寻优能力,求解权重时的适应度值具有更高的计算精度,比基于自然选择的粒子群算法求解权重的适应度值精度提高0.000 000 014 936 617。

(2)改进基于自然选择的粒子群算法具有更好的收敛速度,求解最优权重时所需的迭代次数更少,比基于自然选择的粒子群算法求解权重迭代次数减少了91代。

(3)求解的权重值使得BP神经网络和ARIMA模型的组合预测效果较单一预测模型BP神经网络和ARIMA模型的预测精度和等分权重法赋值权重的组合预测精度更好,预测年度平均预测相对误差分别提高了1.934%、5.009%和1.118%。

猜你喜欢客运量适应度权重改进的自适应复制、交叉和突变遗传算法计算机仿真(2022年8期)2022-09-28基于线网稳定期的地铁客运量预测方法研究黑龙江交通科技(2022年1期)2022-03-14权重常思“浮名轻”当代陕西(2020年17期)2020-10-28为党督政勤履职 代民行权重担当人大建设(2018年5期)2018-08-16一种基于改进适应度的多机器人协作策略郑州大学学报(工学版)(2018年2期)2018-04-13基于空调导风板成型工艺的Kriging模型适应度研究中国塑料(2016年11期)2016-04-16组织知识传播与共享评价指标体系及其RS权重配置郑州大学学报(理学版)(2012年4期)2012-03-25自适应遗传算法的改进与应用*舰船电子工程(2010年1期)2010-04-26

推荐访问:客运量 自然选择 组合