技术站列车晚点时间预测方法
孙略添, 宋瑞, 何世伟, 殷玮川
北京交通大学 城市交通复杂系统理论与技术教育部重点实验室,北京 100044
通讯作者:宋瑞(1971—),女,河北景县人,教授,博士,博士生导师.email:rsong@bjtu.edu.cn.

第一作者:孙略添(1992—),男,吉林长春人,博士生.研究方向为交通运输规划与管理.email:16114187@bjtu.edu.cn.

摘要

准确地对技术站整体列车到达晚点时间进行预测不仅可以为技术站调度预警,也可以为车站合理安排列车进路预留时间,从而尽可能保证货物运到期限,对技术站能力的提高和铁路货运市场的保证具有重要意义.本文分析技术站列车到达晚点情况和技术站列车晚点的主要影响因素.建立GM(1,2)模型对列车晚点时间进行预测,再利用马尔可夫矩阵进行误差修正,确定目标所处区间范围,往复预测并修正,使未来一段时间内的模糊预测结果准确地落在预测区间内;同时利用径向基神经网络(RBF)对数据进行插值扩充,从而对晚点时间进行精确预测,平均相对误差保持在3%以下.最后分析比较了两种预测方法的优劣并分别指出了预测方法的适用范围.

关键词: 铁路运输; 晚点时间预测; 灰色马尔可夫模型; 径向基神经网络; 技术站列车
中图分类号:U294.13 文献标志码:A 文章编号:1673-0291(2018)01-0094-05
Prediction method of train delay time in technology service station
SUN Luetian, SONG Rui, HE Shiwei, YIN Weichuan
MOE Key Laboratory for Urban Transportation Complex Systems Theory and Technology, Beijing Jiaotong University,Beijing 100044, China
Abstract

Accurately forecasting the technology service station train delay time can not only be used for the station warning technology,but also set aside time for the station to arrange train route,as far as possible to ensure the goods to the deadline, so it is important to improve the ability of technology and market of railway freight station with guarantee.This paper analyses the train delay situation and the main influencing factors of technical station train delay. The GM (1, 2) model is used to predict the train delay time and the Markov matrix is used for error correction in order to make sure the range in which the error lie, we can make the prediction in a short term be in the prediction interval by predicting and revising over and over again. In the meantime,we use RBF neural network(NN) to increase the training data by interpolating to predict the delay accurately and the average error is kept be-low 3%. Finally, the advantages and disadvantages of the two forecasting methods are analyzed and compared and we point out the application scope of the prediction method severally.

Keyword: railway transportation; delay time prediction; grey Markov model; RBF network; technical station train

如今货物列车在技术站的晚点已成为了影响货物运到期限的关键因素, 准确对技术站列车晚点时间的预测可以使技术站及早实行调度策略, 使货物列车尽量不逾期.据2016年10月全路班列重点盯控写实表, 全路列车平均到达正点率不到80%, 晚点时长2~3 h的列车占总晚点列车的11.86%, 晚点3 h以上列车占总晚点列车的32.3%.文献[1]针对突发事件下的大面积列车晚点现象建立了晚点判定应急系统; 文献[2]研究了晚点传播链的方法, 并较准确地构建实际列车的晚点传播过程; 文献[3]通过ARIMA模型和多元线性回归模型对飞机到达晚点进行了预测, 提出改进的ARIMA模型, 不考虑其他相关随机变量的变化, 提高预测准确度; 文献[4]建立了灰色马尔可夫模型对道路交通事故进行了预测, 但由于事故的划分缺乏统一的标准, 道路交通事故预测的正确性需要进一步研究; 文献[5]用单因子系统云灰色SCGM(1, 1)c模型拟合系统的发展变化趋势, 并以此为基础改进了马尔可夫预测模型, SCGM(1, 1)c模型兼有单因子系统云灰色模型和马尔可夫链的优点, 能充分利用历史数据给予的信息, 并能克服随机波动性较大的数据列对预测精度的影响; 文献[6]利用径向基神经网络对白银现货的价格进行了预测, 并与BP神经网络进行对比, 验证了径向基网络的准确性, 但当白银价格剧烈波动时, RBF神经网络预测误差较大; 文献[7]通过训练得到的支持向量机(Support Vector Machine, SVM)确定径向基网络的隐层节点个数、隐层权值和阈值, 并利用 SVM对输入向量进行特征变换, 改进径向基神经网络, 避免了神经网络结构选择和局部极小点问题, 从而得到更准确的诊断结果.

目前还没有完备的技术站列车晚点预测方法准确地预测列车晚点时间, 为了保证货物列车在技术站的运到期限, 优化技术站调度, 本文作者提出了两种不同的预测方法应用于不同的技术站环境中.

1 技术站货物列车晚点成因

掌握列车晚点成因[8]可以准确地根据晚点影响因素预测技术站晚点列车数, 使技术站及时采取调度调控等措施, 从而达到货物列车保证运到期限、协调技术站工作等目的, 因此深入研究晚点的成因并对晚点进行准确的预测[9]具有重大意义.列车的晚点因素可分为常态化因素和偶然性因素.常态化因素一般包括到达列车、施工天窗、待避客车等; 偶然性因素一般包括设备故障、自然灾害等.为了取得良好的预测效果, 本文将分别选取不同种类的晚点影响因素作为指标进行晚点时间预测.

2 改进马尔可夫及径向基神经网络

随着我国路网规模的不断扩大, 列车开行密度的不断提高, 路网具有了越来较高的敏感性.若能有效地预测并确定干扰影响范围, 有针对性的对该影响范围内列车的运行策略进行调整, 可高效消除干扰引起的列车晚点传播影响, 快速恢复运营秩序.因此, 构建高效准确的晚点预测模型对列车的运营指挥有着重要的意义.灰色马尔可夫模型[10, 11, 12]根据数据及其影响因素的变化趋势, 兼具灰色模型和马尔可夫随机过程的优点, 大大降低了预测结果的误差; 径向基神经网络[13]不需要进行反向误差传播的计算, 而是完全前向的计算过程, 具有高预测精度、高收敛速度的特点.本文利用上述两种预测方法分别对技术站列车晚点时间进行预测[14], 并对比分析了不同预测方法的不同特点及使用环境.

2.1 技术站晚点预测的灰色模型

GM (1, N)模型[15]是一种能够对数据进行分析并预测的灰色模型, 表示有一组系统特征序列, n-1组相关因素序列.设系统特征数据序列为

X10=x101, x102, , x10n(1)

相关因素序列为

X10=x101, x102, , x10nX20=x201, x202, , x20nX30=x301, x302, , x30n          Xn0=xn01, xn02, , xn0n(2)

式中: Xi1Xi0的1-AGO序列, i=1, 2, , N; Z11=z111, z212, , z11nX11的紧邻均值生成序列, 则GM (1, N)模型为

x10k+az11k=i=2Nbixn1k(3)

式中: a为发展系数; bixi1k为驱动项; bi为驱动系数; 参数列 a˙=a, b1, b2, , bNT的最小二乘估计为

a˙=BTB-1BTY(4)

其中:

B=-z1(1)(2)x2(1)(2)xN(1)(2)-z1(1)(3)x2(1)(3)xN(1)(3)-z1(1)(n)x2(1)(n)xN(1)(n), Y=x1(0)(2)x1(0)(3)x1(0)(n).

GM (1, N)模型的近似时间响应式为

x˙11k+1=x1(0)(1)-1ai=2Nbixi(1)(k+1)e-ak+1ai=2Nbixi(1)(k+1)(5)

根据实际数据与所得模拟数据进行比较, 残差为

εk=x0k-x0k(6)

相对误差为

δ=εkx0k(7)

通过相对误差的大小来评价模型模拟的准确度.

2.2 马尔可夫过程误差修正

马尔可夫状态转移矩阵为

Pm=pijm(8)

式(8)表示马氏过程 m次转移矩阵; pij表示从 i状态转移到j状态的概率为 pij.n次概率转移矩阵为

Pn=P0Pn(9)

式中: P0为初始分布行向量.本方法利用马氏过程对灰色模型的残差进行修正并预测灰色模型预测结果的残差, 从而使最终预测结果更精确.再将灰色马尔可夫预测结果加入到已知数列中, 作为已知数据对接下来的时间段进行预测, 往复循环, 可获得接下来时间段的较精确预测值.

2.3 径向基神经网络技术站列车晚点时间预测

径向基神经网络[16]有良好的模式分类和函数拟合能力, 是一个3层的前向网络, 第1层为输入层, 节点个数等于输出的维数; 第2层为隐含层, 节点个数视问题复杂度而定; 第3层为输出层, 节点个数等于输出数据的维数.

在进行晚点时间预测的过程中, 首先进行样本定义; 再进行数据划分和测试, 将一部分数据用于神经网络训练; 然后为充分利用训练样本, 将训练样本进行二维插值, 增加样本数量, 利用Matlab的二维插值函数interp 2进行数据扩充; 最后利用newrb函数创建神经网络并完成预测显示结果.

3 技术站到达列车晚点预测实例分析
3.1 灰色模型预测

表1数据来源于2016年10月1日~10月26日全路班列重点盯控写实表, 包括全路技术站整体的到达列车数、到达晚点列车数的晚点时间.

表1 全路班列重点盯控写实表 Tab.1 Railway trains focus on control of realistic

根据模型计算结果, 可得参数 a=0.7183; b1=0.0654; b2=1.0994; 将参数代入式(5)中计算可得.

表1可知, 所构建的GM(1, 2)模型中, 7、10、19日的相对误差较高, 均超过20%, 说明模型需要进一步改进.

3.2 马尔可夫矩阵误差修正结果

由于状态转移是随机的, 因此, 必须用概率来描述状态转移可能性的大小, 即状态转移概率.由状态 Er转移到状态 Es(s> r)的概率, 即转移概率

Prs=PEs|Er=PEsEr=Pxn+1=s|xn=r(10)

根据灰色模型预测结果按相对误差大小将数据分为[-30%, -10%]、[-10%, 10%]、[10%, 25%]3个区间, 利用马尔可夫转移矩阵对误差进行修正.用频率近似替代概率构造转移概率矩阵

P= p00p01p02p0ip10p11p12p1ipi0pi1pi2pii.

根据表1相对误差所处区间, 可进一步得到转移概率矩阵为

P=01212152525381218.

转移矩阵确定后, 便可根据某日所处状态来预测下日可能出现的状态, 再对各个状态所处区间范围进行加权平均, 最终求出灰色马尔可夫预测值, 具体如下:由于26日相对误差为5.41%, 所处状态为2, 所以根据一步状态转移矩阵, 27日所处状态最可能是2或3, 此时误差区间 εk-10%, 10%10%, 25%, X=Xε+1, 则 X(27)38.16, 43.3643.36, 53, 27日实际值为48.5 h, 在所预测区间内.将27日预测值加入表1中, 可以获得更新过后的一步概率转移矩阵

P=01212311411411381218,

同理可得28日的灰色马尔可夫预测区间为[22.95, 31.8], 具体见表2, 由此可知, 灰色马尔可夫预测可以给出较精准的结果所处区间.

表2 灰色马尔可夫模型预测结果 Tab.2 Prediction results of Grey Markov model
3.3 径向基神经网络预测

径向基神经网络预测步骤如下:

1)根据表1中数据, 定义各样本的输入向量及其目标输出值.输入向量定义为2× 31的矩阵, 目标输出值为1× 31行向量.

2)使用第1至29日的晚点数据作为训练样本得出模型, 再对30、31日两日晚点数据进行预测检验.

3)利用interp 2函数对29份训练样本进行二维插值, 将样本数量增加到200份.先将训练输入向量与对应的目标输出合并为一个3× 29的矩阵, 经过插值, 得到一个3× 200的矩阵, 最后再将其拆分为2× 200的训练输入矩阵和一个1× 100的样本输出矩阵.

4)设置误差容限为10-8, 扩散因子为22, 最大神经元个数为101.进行训练并在Intel(R) Core(TM)i3-3200M CPU 2.5 GHz、4G RAM计算机运行Matlab软件求解, 运行时间为2.3 s, 结果如表3所示.预测结果与真实值对比如图1所示.

表3 径向基神经网络预测结果 Tab.3 Prediction results of RBF NN

图1 预测值与真实值对比图Fig.1 Comparison of predicted and real values

由图1可以看出, 预测值与真实值是非常接近的, 且预测值与真实值的变化趋势完全一致.从相对误差的角度来说, 2份测试样本平均相对误差接近3%, 因此有理由认为, 径向基网络对晚点时间的变化及变化趋势进行了较好的预测.

3.4 对比分析

对比表4和表5中灰色马尔可夫模型和径向基神经网络30、31两日预测结果, 可以看出, 灰色马尔可夫模型可以较好地预测出列车到达技术站的晚点时间范围; 神经网络预测需要经过对历史数据的训练, 从而得到较准确的预测数据.从预测准确度来看, 灰色马尔可夫模型可以预测出一个确切的结果区间和一个晚点时间变化趋势; 神经网络的误差较低, 预测精度较高, 属于大数据精确预测方法.从所需数据规模上看, 神经网络需要的数据较多, 预测成本较高, 本文中的预测模型至少需要29日的晚点时间数据并加以插值才能得到预测误差较小的结果; 灰色马尔可夫预测成本较小, 至少需要5日的晚点数据就可以进行预测, 数据越多预测结果越准确.

4 结论

本文应用了混合灰色预测模型和径向基神经网络分别进行了预测, 检验模型的准确性的同时将两种预测方法进行了对比.

1) 灰色马尔可夫可以有效将实际结果预测在预测区间中, 相对误差在5%以下, 适用于晚点历史数据较少时, 小规模技术站, 虽然不能准确地预测到时间点, 但是同样可以为技术站调度起到预警的作用.

2)RBF神经网络的平均相对误差在3%左右, 说明预测结果较准确, 可有效应用于晚点时间预测问题中, 适用于拥有晚点历史数据较多、大规模、对运到期限要求较高的技术站.

3)灰色马尔可夫预测方法在显示工作中, 原始输入数据的波动可能会对预测结果带来较大干扰, 在今后的研究中, 可以结合支持向量机方法, 减少原始数据波动带来的预测误差, 使预测更加准确.

The authors have declared that no competing interests exist.

参考文献
[1] 韩国兴. 突发事件下列车大面积晚点分析与应急处置系统研究[D]. 北京: 北京交通大学, 2014.
HAN Guoxing. Analysis and emergency disposal system research of train delay on large scale in emergency[D]. Beijing: Beijing Jiaotong University, 2014. (in Chinese) [本文引用:1]
[2] 孟令云, Rob MP Goverde. 基于实际数据分析的列车晚点传播过程构建方法与实例[J]. 北京交通大学学报, 2012, 36(6): 15-20.
MENG L Y, GOVERDE R M P. A method for constructing train delay propagation processby mining train record data[J]. Journal of Beijing Jiaotong University, 2012, 36(6): 15-20. (in Chinese) [本文引用:1]
[3] 程洁. 基于时间序列数据分析的飞机延迟预测研究[D]. 南京: 南京邮电大学, 2015.
CHENG Jie. Flight delay prediction study based on splinecurves[D]. Nanjing: Nanjing University of Posts and Telecommunications, 2015. (in Chinese) [本文引用:1]
[4] 李相勇, 张南, 蒋葛夫. 道路交通事故灰色马尔可夫预测模型[J]. 公路交通科技, 2003, 20(4): 98-100.
LI Xiangyong, ZHANG Nan, JIANG Gefu. Grey-Markov model for forecasting road accidents[J]. Highway Traffic Science and Technology, 2003, 20(4): 98-100. (in Chinese) [本文引用:1]
[5] 张超, 马存宝, 许家栋, . 基于灰色马尔可夫SCGM(1, 1)c模型的空难人数预测[J]. 系统工程理论与实践, 2006, 26(5): 135-139.
ZHANG Chao, MA Cunbao, XU Jiadong, et al. Apply gray Markov SCGM(1, 1)c model to predict air disaster death toll[J]. Systems Engineering Theory and Practice, 2006, 26(5): 135-139. (in Chinese) [本文引用:1]
[6] 杨学文. 基于径向基神经网络的白银现货价格预测研究[D]. 秦皇岛: 燕山大学, 2015.
YANG Xuewen. The study onprediction of spot silver price based on RBF Neural Network[D]. Qinhuangdao: Yanshan University, 2015. (in Chinese) [本文引用:1]
[7] 饶泓, 虞国全, 胡倩如. 基于支持向量机的径向基网络结构优化[J]. 计算机工程与应用, 2008, 44(5): 67-69.
RAO Hong, YU Guoquan, HU Qianru. RBF neural network structure optimization method based on SVM[J]. Computer Engineering and Applications, 2008, 44(5): 67-69. (in Chinese) [本文引用:1]
[8] 陈东, 彭其渊, 李永辉. 列车到达晚点对技术站车流接续影响仿真分析[J]. 西南交通大学学报, 2014, 49(6): 1108-1115.
CHEN Dong, PENG Qiyuan, LI Yonghui. Simulation of effect of train arrival delay on wagon flow connection at technical stations[J]. Journal of Southwest Jiaotong University, 2014, 49(6): 1108-1115. (in Chinese) [本文引用:1]
[9] 朱炜, 韩斌. 运输需求预测综合集成方法研究[J]. 交通运输系统工程与信息, 2013, 13(3): 25-32.
ZHU Wei, HAN Bin. A meta-synthesis method for transportation demand forecasts[J]. Transportation System Engineering and Information, 2013, 13(3): 25-32. (in Chinese) [本文引用:1]
[10] KUMAR U, JAIN V K. Time series models (Grey-Markov, Grey Model with rolling mechanism and singular spectrum analysis) to forecast energy consumption in India[J]. Energy, 2010, 35(4): 1709-1716. [本文引用:1]
[11] GASSIAT E, CLEYNEN A, ROBIN S. Inference in-finite state space non parametric hidden Markov models and applications[J]. Statistics and Computing, 2016, 26(1): 1-11. [本文引用:1]
[12] HEF L, HU Y, CHEN C. Forecast of grain output in China with grey Markov forecasting model[J]. Mathematics in Practice & Theory, 2003, 1(12): 45-47. [本文引用:1]
[13] 孙湘海, 刘潭秋. 基于神经网络和SARIMA组合模型的短期交通流预测[J]. 交通运输系统工程与信息, 2008, 8(5): 32-37.
SUN Xianghai, LIU Tanqiu. Short-term traffic flow forecasting based on neural network model and SARIMA model[J]. Transportation System Engineering and Information, 2008, 8(5): 32-37. (in Chinese) [本文引用:1]
[14] 朱昌锋. 基于模型组合的铁路集装箱运量预测[J]. 交通运输系统工程与信息, 2010, 10(5): 149-153.
ZHU Changfeng. Freight volume forecasting of railway container based on model combination[J]. Transportation System Engineering and Information, 2010, 10(5): 149-153. (in Chinese) [本文引用:1]
[15] ZHANG S H, CAO J H, CHEN M Y. Grey Markov SCGM(1, 1) prediction model[J]. Journal of Foshan University, 2004, 1(11): 16-19. [本文引用:1]
[16] SINGH V, RAO S M. Application of image processing and radial basis neural network techniques for ore sorting and ore classification[J]. Minerals Engineering, 2005, 18(15): 1412-1420. [本文引用:1]