第一作者:袁坚(1965—),男,江苏东台人,教授,博士. 研究方向为信息与网络安全、网络移动性、动力学复杂性和认知网络等.email:jyuan@tsinghua.edu.cn.
随着城市轨道交通网络运营里程的不断增长及网络承载客流量的不断提高,特定站点客流量极易发生急剧变化,这种变化引起整个网络客流量的不均匀分布,从而增加运营调度的难度和运营事故的发生概率.本文以城市轨道交通实际运营中采集的大量客流数据为基础,从时间和空间两个维度分析城市轨道交通客流分布的特点,并进一步提出基于贝叶斯网络的客流量预测方法,实现对特定站点的客流量预测.本实验完全基于实际数据,结果表明:预测客流量平均绝对百分比误差基本在0.1以下,预测准确程度较高.
With the expanding of urban rail transit network revenue length and the increasing of its passenger volume, the passenger volume for some subway stations is susceptible to rapid changes, which can easily incur uneven distribution of the entire network traffic. It could therefore increase the difficulty of rail transit operations and probability of operational incidents. On the basis of passenger volume data collected from practical operation, this paper analyzes the temporal and spatial characteristics of the passenger volume. It also proposes a passenger volume prediction method using the Bayesian network to predict the passenger volume of certain subway stations. Based on practical data, these numerical experiments demonstrate that the proposed method can achieve an mean absolute percentage error below 0.1 when predicting, proving the model is highly accurate.
城市轨道交通是城市公共交通系统的重要组成部分, 是城市交通的主动脉.随着城市轨道交通网络日趋复杂和日均客流量屡创新高, 轨道交通网络单点客流量极易突变, 单条线路甚至路网的短时瘫痪可能性大大提高, 进而增加轨道交通路网运营的各类潜在风险[1].充分利用城市轨道交通实际运营数据, 掌握特定站点客流量分布的时空规律[2, 3, 4, 5], 能够降低预测客流量的平均绝对百分比误差, 从而提高客流量预测准确程度, 对疏导客流和合理配置运营资源具有重要意义.
目前, 城市轨道交通客流量的规律分析和预测方法已经成为近年来的研究热点.文献[6]通过出行总量预测、小区OD出行预测、进出站流量预测和交通网流量分配4个阶段分析, 建立了客流预测分析模型.文献[7]建立了面向“ 区域+市区” 的多层次多模式客流预测方法, 提出了权重分配法、类重力模型法和目的地选择模型法.文献[8]利用实际客流数据, 针对北京城市轨道交通的特有特征深入分析研究了BP神经网络用于客流预测的实用性和合理性.文献[9]通过聚类分析, 建立了基于改进BP神经网络的轨道交通短时客流预测模型.上述研究着重从单个因素建模预测轨道交通客流量, 然而从实际轨道交通运营数据来看, 轨道交通客流量往往受多个因素同时影响[10, 11].
本文作者以城市轨道交通自动售检票系统采集的实际客流数据为基础, 将城市轨道交通中的车站分普通站和换乘站, 分析客流分布的时间和空间特征; 借助贝叶斯网络(Bayesian Networks, BN)方法, 按工作日和非工作日分类, 对影响客流量的历史信息、邻站信息等因素进行贝叶斯网络建模, 实现特定车站、特定时间轨道交通车站进和出站客流量预测.
客流数据来源于北京轨道交通某线路自动售检票系统采集的实际客流信息, 包含24个车站、24个月(2013-07-01— 2015-06-30)进站和出站客流量.系统每隔30 min采集数据样本, 即每当整点和半点时刻完成一次数据的收集、汇总和存储.该线路每天地铁运营约19.5 h(运营时间为4:40-23:38), 合计每天采样39段.该线路共有普通车站(非换乘车站)16座、换乘车站8座, 按由北至南顺序对车站简化命名为ST.1至ST.24, 线路具体情况如图1所示.
收集本线路24个车站的进站、出站客流量生成两组数据, 每组数据的时间跨度均为730 d, 形成矩阵为730× 39行、24列的轨道交通客流矩阵C.
1.2.1 时间分布基本特征
在获得的轨道交通客流数据矩阵中, ST.4相邻车站无换乘情况, 附近无交通枢纽或商业中心等明显引起客流剧增的情况, 为典型的普通车站; 车站ST.21与另一条地铁、火车站换乘, 为交通枢纽换乘车站, 故选取此两站作为典型车站.下文中均以此两站为例, 随机选取一周时间(2015-06-22— 2015-06-28)说明轨道交通客流时间特征(见图1).
1)从时间维度上看, 工作日轨道交通客流早晚高峰特征明显.从图2可以看出, 在工作日早7:00-9:00、晚5:00-7:00出现客流高峰, 普通车站和换乘车站早、晚高峰客流量峰值远远大于平峰时段平均客流量, 换乘车站在周一早高峰、周五晚高峰出现明显大客流现象.
2)工作日和非工作日的客流趋势差异显著.以普通车站ST.4为例, 非工作日客流总量比工作日客流总量有所降低, 减少约29.2%; 而换乘车站ST.21非工作日客流总量较工作日客流总量有所增加, 增加约26.7%.非工作日则无明显客流早晚高峰现象, 但出行时间相对集中, 一般在10:00-14:00期间达到客流峰值.工作日和非工作日的高峰客流变化表明不同时间段人们出行规律不同.
1.2.2 相邻时间段客流特征
1)客流在时间尺度上具有稳定性, 同一时段历史客流数值相近.以一年(2014-07— 2015-06)所有工作日的8:30-9:00为例计算客流稳定程度, 并以标准差系数来反映变动程度, 标准差系数越小说明客流变化程度越小, 见表1.
![]() | 表1 普通车站和换乘车站客流时间尺度特征 Tab.1 Time scale characteristics of passenger flow at ordinary & transfer station |
标准差系数V计算方法:V=σ /
上述数据的标准差系数说明工作日同一时段客流量波动不大, 因此, 客流的历史数值相关性可以作为客流预测的因素之一.
2)相邻时段客流量具有相关性, 分别以普通车站(ST.4)和换乘车站(ST.21)为例, 对比一年所有工作日中8:00-8:30、8:30-9:00、9:00-9:30共3个时间段的进、出站客流量相邻时段差值的累计分布函数(Cumulative Distribution Function, CDF)曲线, 如图3所示, 结果表明:同一站点相邻时间段进站、出站客流量变化趋势基本相近, 在客流时间特征上具有相关性, 仅在客流量级上有所差异; 在后续预测中, 本实验对客流量进行量化分级.由于客流变化趋势具有相关性, 量化后各级之间变化也具有相关性, 故相邻时间段客流量相关性是客流预测的一项重要因素.
1.3.1 空间分布基本特征
由于线路各车站周边用地类型不同, 如交通枢纽、商业区、景区和高校等, 轨道交通客流在空间分布上存在显著的不均衡性, 普通车站和换乘车站客流量有巨大差异性.根据获得的轨道交通客流数据矩阵, 以典型的轨道交通地铁车站(普通车站、换乘车站)的特定时间(2015-06-22— 2015-06-28)为例, 分析轨道交通客流空间特征如图2所示.
从图2中可以看出, 换乘车站ST.21平均进、出站客流量约是普通车站ST.4的4倍; 从客流变化趋势上看, 普通车站和换乘车站的趋势相近, 两车站均出现早晚高峰客流剧增现象.
1.3.2 相邻车站客流特征
相邻车站空间距离相近, 故其客流量存在相关性.分别以普通车站(ST.4)和换乘车站(ST.21)为例, 对比一年(2014-07— 2015-06)所有工作日的8:30-9:00时段进、出站客流量相邻车站差值的CDF曲线.如图4所示, 可以发现相邻车站客流量的变化趋势相近.因此, 客流量在空间特征上具有的相关性, 仅在客流量级上有所差异, 故相邻车站的客流量空间相关性也可以作为客流预测的因素之一.
预测模型根据轨道交通中地铁客流时空特征, 将客流量分成不同等级, 采用贝叶斯网络(Bayesian Networks, BN)方法, 综合考虑客流量时间相关性、客流量空间相关性、客流量历史数据相关性等因素, 通过实际数据实现特定站点的进、出站的客流预测.
根据贝叶斯网络理论, 建立客流预测模型[12, 13], 如图5所示.
1)从客流矩阵C中提取相关的客流时间数据Q1、客流空间数据Q2和客流历史数据Q3.以Q(t, s)表示站点s在第t个时间点客流量, Q(t-T, s)表示本站点在第t个时间点历史同时段客流量, T表示每天时段总数.结合1.2节、1.3节中结论, 带预测客流量状态Q(t, s)(简化为QP)受时间数据Q(t-1, s)(简化为QT)、客流空间数据Q(t-1, s-1)(简化为QS)和历史客流数据Q(t-1, s)(简化为QH)的综合影响.
2)选取待预测客流量QP, 参考交通状态推算模型[12], 并结合实际轨道交通客流特征与城市道路交通规划设计规范, 对相关客流数据QT、QS、QH进行量化分级, 分为n级, 每一级记为i(i=1, …, n), 计算各组数据每个客流等级概率P
3)依据每个客流等级概率P
假设时间数据
将式(2)代入式(1)中, 式(1)可简化为
4)分别计算P(
采样时间序列数据、空间数据和历史时段客流数据, 基于贝叶斯网络客流量预测模型, 总结先验知识, 实现对特定车站s、特定时段t客流量状态的预测, 最终得到客流量预测值.
1)根据2.1节模型, 选择预测时间段、空间、训练序列长度.①时间段选择:选取典型预测时段为工作日的早高峰时段(选取时段为8:30-9:00).②空间选择:典型车站选择普通车站ST.4和换乘车站ST.21.③训练序列长度L选择:训练序列长度可变, 通过数据训练得出, L取22 d时预测效果最优.最后, 通过一定时间段验证模型预测效果, 验证时间段设置为244 d.
2)通过已采集的客流量数据C, 根据步骤1)中的设置, 生成可用进、出站客流量矩阵C1、C2.
3)对客流量矩阵C1、C2进行量化分级, 分为n级, 每一级记为i(i=1, …, n), 计算客流量化等级基础值Qstep, 公式为
经验证将客流状态划分平均为6个等级最为合理, 即n=6.
4)计算各进、出站客流等级i的客流均值Qi_ong和对应的概率分布P(
5)计算客流量等级i时间数据
6)根据式(3)和步骤4)、5)得出的数据P(
7)结合步骤4)Qi_ong和步骤6)P(
1)选取客流数据中一年时间工作日早高峰时段(8:30-9:00), 对普通车站ST.4和换乘车站ST.21进站客流量贝叶斯网络预测, 结果如图7所示, 表明进站客流预测值与实际值符合程度较高.
![]() | 图7 进站客流预测值与实际值的差值CDF曲线Fig.7 CDF curves of the difference between predicted value and the actual value of inbound passenger flow |
客流量预测方法有一定的异常检测能力, 本预测算法通过大量数据, 综合历史数据相关性、相邻时间段和相邻车站相关性进行预测.如果实际客流量数据明显与预测客流量数据存在较大差异(排除已知的客流异动状态), 这种较大差异性可作为异常检测的判断依据.如图6所示, 普通车站客流量曲线中有7个异常点, 换乘车站客流量曲线有4个异常点.
2)以进站客流量预测值与实际值之差做CDF曲线, 如图7所示, 普通车站预测值与实际值相对误差的绝对值小于100(此段客流均值为593)的点占比在90% 以上, 换乘车站预测值与实际值相对误差的绝对值小于500(此段客流均值为2 352)的点占比在90% 以上.
平均绝对百分比误差(Mean Absolute Percentage Error, MAPE)是一种统计学上对预测精度的度量方法.定义Δ MAPE=
1)选取客流数据中一年时间工作日早高峰时段(8:30-9:00), 对普通车站ST.4和换乘车站ST.21出站客流量进行贝叶斯网络预测, 结果如图8所示.
客流量预测值与实际值符合程度较高.同进站客流预测情况类似, 出站客流预测方法也具有一定的异常检测能力, 如图8所示, 普通车站客流量曲线中有5个异常点, 换乘车站客流量曲线有3个异常点.
2)以出站客流量预测值与实际值之差做CDF曲线, 如图9所示.
![]() | 图9 出站客流预测值与实际值的差值CDF曲线Fig.9 CDF curves of the difference between predicted value and the actual value of outbound passenger flow |
普通车站预测值与实际值相对误差的绝对值小于90(此段客流均值是452)的点占比在90% 以上, 换乘车站预测值与实际值相对误差的绝对值小于350(此段客流均值是2 847)的点占比在90% 以上.计算预测出站客流平均绝对百分比误差, 普通车站Δ MAPE=0.103 4, 换乘车站Δ MAPE=0.060 0, 说明模型预测性能良好.
本文作者对城市轨道交通进、出站客流量的预测方法进行了研究, 阐述了客流量时、空特点并进行深入分析, 借助贝叶斯网络方法, 结合客流分布的相邻时间、相邻空间、历史时段数据等相关性特征, 建立贝叶斯网络客流量预测模型, 并通过大量实际数据分析, 对特定车站、特定时间客流量进行预测; 结果显示客流Δ MAPE大多小于0.1, 可以满足轨道交通运营和调度要求, 同时本模型具有的异常检测能力, 进一步加强了本模型的实用性.
本文的贝叶斯网络客流预测模型可以实现后台快速实时计算, 为城市轨道交通人流密度预警、客流引导和运营调度提供重要数据依据.
The authors have declared that no competing interests exist.
[1] |
|
[2] |
|
[3] |
|
[4] |
|
[5] |
|
[6] |
|
[7] |
|
[8] |
|
[9] |
|
[10] |
|
[11] |
|
[12] |
|
[13] |
|