基于增强型BN的CTCS-1级ATP可靠性研究
刘中田, 徐越, 王昊
北京交通大学 电子信息工程学院,北京 100044

第一作者:刘中田(1979—),男,安徽蚌埠人,副教授,博士.研究方向为列控系统建模、可靠性与安全性.email:liuzht@bjtu.edu.cn

摘要

结合CTCS-2级与CTCS-3级列控系统设计和运用经验,铁路总公司提出了CTCS-1级列控系统的研制需求,该系统车载ATP设备将取代LKJ与机车信号对既有线列车的控制.本文以CTCS-1级ATP为主要研究对象,对比分析模块级冗余与系统级冗余方案下CTCS-1级ATP系统可靠性.根据CTCS-1级列控系统总体技术方案,构建模块级冗余与系统级冗余ATP可靠性框图,建立对应增强型贝叶斯网络(BN)模型.借助增强型BN正向推理,求解两种设计方案下ATP可靠性定量指标,评估两种设计方案的优劣.利用增强型BN模型逆向推理,求解列车超速防护(ATP)设备故障下基本单元条件失效概率,查找两种冗余设计方案的潜在薄弱环节.评估结果表明:两种方案下CTCS-1级ATP RAM指标均满足需求规范要求,但采用模块级冗余设计的CTCS-1级ATP RAM指标更优;外围冷备模块条件失效率明显高于其他模块,为CTCS-1级ATP的薄弱环节.

关键词: 列车运行自动化; 增强型BN; RAM; CTCS-1; ATP
中图分类号:U284.48
Reliability analysis of CTCS-1 ATP based on enhanced Bayesian network
LIU Zhongtian, XU Yue, WANG Hao
School of Electronic and Information Engineering, Beijing Jiaotong University, Beijing 100044,China
Abstract

China Railway Corporation has proposed the development requirements of CTCS-1 train control system based on design and application experience of CTCS-2 and CTCS-3 train control system. The vehicle ATP equipment in this system will replace LKJ and cab signal controlling the existing railway line. CTCS-1 ATP equipment is studied in this paper and comparative analysis of reliability of CTCS-1 ATP system is conducted between modular and system redundancy. Firstly, CTCS-1 ATP reliability block diagrams are established according to the integral technical scheme of CTCS-1 train control system.Correspondingly, the enhanced Bayesian network model is set up.Secondly, the quantitative reliability indexes of CTCS-1 ATP on the foundation of modular and system redundancy are obtained through forward reasoning of enhanced Bayesian network,then the advantages and disadvantages of these two designs are evaluated. Finally, the basic unit conditional failure probability of ATP equipment is obtained through the backward reasoning of en-hanced Bayesian network , and the potential weak links of two redundancy designs are found out. The evaluation results show that the RAM indexes of CTCS-1 ATP under the condition of two redundancy designs can meet the requirements of Chinese train control system requirement specifications, but the RAM indicators of CTCS-1 ATP applying the modular redundancy design are better than those using the system redundancy design; and the conditional failure rate of peripheral cold standby module is higher than other modules, which is the weak link of CTCS-1 ATP.

Keyword: train running automation; enhanced Bayesian network; RAM; CTCS-1; ATP

为改善既有线现状与实现列控关键技术全面自主化, 铁路总公司提出升级既有线列控设备的重大项目:CTCS-1级列控系统关键技术研究[1].但目前CTCS-1级列控系统一直没有统一的技术实施方案, 为改善既有线现状, 推动既有线路列控系统发展, 铁路总公司组织制定了CTCS-1级列控系统总体技术方案[2].CTCS-1级列控系统适用200 km/h以下新建及改造线路, 采用速度-距离控制模式曲线监控列车安全运行, 由轨道电路实现占用检查并提供行车许可信息, 无源应答器实现列车定位, 并以无线通信方式传输列车进路数据和临时限速信息[2].新一代CTCS-1级列车自动防护(Automatic Train Protection, ATP)设备将采用模块化和分布式设计, 其安全完整性等级达到CENELIC规定的SIL4级[3, 4].CTCS-1级ATP设备功能层次复杂, 包含多个功能模块和多层结构, 而 ATP设备本身为安全苛求设备, 系统可靠性与安全性成为决定CTCS-1级ATP能否安全和正常工作的重要因素.为保证设备可靠性与安全性, 铁科院, 和利时等参与CTCS-1级ATP研发的单位采用不同冗余设计方案以满足其可靠性与安全性要求, 其中典型的ATP系统设计方案为模块级冗余和系统级冗余方案.

目前列控系统可靠性研究主要集中在CTCS-2级与CTCS-3级列控设备.文献[5]采用马尔科夫状态转移法分别求解CTCS-3级列控各个子系统可靠性指标, 最终利用系统串并联模型求解整体可靠性指标.文献[6]利用动态故障树定量计算采用解析法、马尔科夫矩阵迭代法与分层迭代法评估CTCS-3级ATP系统可靠性.文献[7]采用Markov状态转移法分析计算CTCS-2级列控系统稳态有效度, 通过实例计算验证CTCS-2级列控设备的高可靠性.上述文献均针对CTCS-3级与CTCS-2级列控系统可靠性进行研究.

目前缺少针对CTCS-1级列控ATP系统的可靠性研究, 本文作者以CTCS-1级ATP为研究对象, 采用增强型贝叶斯网络方法(Bayesian Network, BN)分别对模块级冗余和系统级冗余方案下CTCS-1级ATP系统建模, 并评估两种设计方案下CTCS-1级ATP系统RAM是否满足现行列控系统需求规范要求, 分析比较两种设计方案的优劣.

1 增强型贝叶斯网络

增强型BN为有向无环图, 由变量节点、有向边、逻辑门与条件概率表组成, BN网络能借助条件概率表对模型进行推理运算[8].简单的增强型贝叶斯网络如图1所示.

图1 增强型贝叶斯网络Fig.1 Diagram of enhanced BN

图1所示增强贝叶斯网络条件概率公式为

P(P3=1|P2=0, P1=0)=0(1)P(P3=1|其他)=1(2)P(P5=1|P4=1, P3=1)=1(3)P(P5=1|其他)=0(4)

式中:“ 0” 表示节点状态正常; “ 1” 表示节点状态故障; “ AND” 与“ OR” 表示上下节点的故障逻辑关系.式(1)表示变量节点P1、P2状态均正常情况下, 变量节点P3正常; 式(2)表示若P1、P2中任何一个故障均导致P3故障; 式(3)变量节点P5只有在P3、P4同时故障时才故障; 式(4)变量节点P5在P3、P4节点非全部故障时处于正常态.

增强型BN具有双向推理能力, 擅长表达变量之间相关性与不确定性.增强型BN有直接建立法与模型转化法两种建模方法:1)在熟悉研究对象的结构组成与模块间依赖关系的情况下, 可以先建立其可靠性框图, 然后直接建立对应的增强型BN模型.2)对于大型复杂系统, 结构层次众多, 模块间依赖关系不清晰, 在不熟悉内部结构与模块间依赖关系的情况下, 需借助其现存的模型, 采用模型转化方法建立其增强BN模型.

2 CTCS-1级ATP结构和功能分析

CTCS-1级ATP为新一代既有线列车超速自动防护设备, 其结构示意如图2所示.

图2 CTCS-1级ATP内部模块示意图Fig.2 Schematic diagram of CTCS-1 ATP internal modules

图2中CTCS-1级ATP由C1与C0两个主控模块构成.C1级主控模块负责C1级线路区段控车, 列车运行至非C1级线路区段, ATP切换到C0级主控模块, C0级主控模块控制功能的实现, 需要 C1级主控模块的辅助与监管.CTCS-1级ATP外围设备还包括无线通信模块(GSM-R)、轨道电路读取器(TCR)、应答器传输模块(BTM)及应答器天线(BTM-Ant)、人机界面(DMI)、列车接口单元(TIU)、测速测距单元(SDU)、数据记录单元(DRU)、机车信息检测装置(TAX)和列车运行状态信息系统(LAIS), 由于TAX和LAIS属于数据记录装置, 与控车无关, ATP可靠性研究中不包含这两个模块.

CTCS-1级ATP系统根据TCR信息、BTM信息、GSM-R传输的无线消息、临时限速命令、生成速度-距离控制模式曲线监控列车运行.CTCS-1级ATP基本单元功能如下:1)GSM-R车载电台及无线天线:接收地面区域数据控制中心发送的固定线路数据信息, 临时限速信息, 解析处理信息并送至C1主控单元.2)TCR及天线:接收与解析轨道电路行车许可信息, 并将该信息送至C1主控单元.3)BTM及天线:接收与解析地面应答器信息, 信息处理后送至C1与C0主控单元.4)DMI:显示控车曲线与列车状态信息, 提示告警信息, 为司机提供信息输入的界面.5)DRU:记录列车的运行状态及司机进行的操作, 为列车故障诊断与行车事故责任划分提供依据. 6)SDU:实时检测列车的运行速度, 并计算列车的运行距离, 为生成速度-距离模式曲线提供数据.7)TIU:用于传输ATP下达的控车信息, 反馈列车的运行状态.8)C1主控单元C1-CM和C0主控单元CO-CM分别是CTCS-1/CTCS-0级列控系统的核心, 由车载安全计算机组成, 将接受的轨道电路信息、应答器信息、临时限速信息与线路信息进行安全运算处理, 形成目标-距离速度监控曲线, 监控列车安全运行.

由CTCS-1级列控系统总体设计方案知[2], 轨道电路读取器及天线、应答器传输模块及天线、测速测距单元、无线通信模块、C1主控单元和C0主控单元均与控车相关, 为安全苛求设备, 人机界面与数据记录单元不提供空车数据, 不影响列车运行安全是非安全苛求设备.列控设备研发单位对安全苛求设备采用双系热备冗余方式配置, 对非安全苛求设备采用双系冷备冗余方式配置.

3 CTCS-1级ATP系统模型建立
3.1 CTCS-1级ATP内部结构与模块间关系

根据CTCS-1级列控系统总体设计方案[2], 构建CTCS-1级ATP结构图及确定内部模块间依赖关系, 如图3所示.将ATP设备分解, 拆分为BTM、TCR、DMI、SDU、TIU和主控制单元(MCU)六大模块, 它们任何一个模块故障均直接导致ATP故障, 故它们位于体系结构第2层, ATP与其依赖关系用“ OR” 表示.TCR分为TCR主机和TCR天线, 任何一个模块故障均导致TCR故障, 故依赖关系为“ OR” , BTM模块、C1-CM、无线通信模块同理.但对于MCU, 只有C0控制模块C0-CM和C1控制模块C1-CM都故障时, 才会导致MCU故障, 故依赖关系为“ AND” .

图3 CTCS-1级ATP结构组成及模块间依赖关系Fig.3 Structure composition of CTCS-1ATP and dependency among modules

图3中所有模块参与控车, 均为安全苛求模块

3.2 CTCS-1级ATP增强型BN模型构建

3.2.1 CTCS-1级ATP可靠性框图

目前CTCS-1级ATP设计主要采用模块级冗余和系统级冗余两种设计方案以保证ATP设备的可靠性与安全性.为评估两种设计方案可靠性的优劣, 在两种设计方案的可靠性框图基础上, 分别建立对应的增强型BN模型, 并进行可靠性评估.

根据CTCS-1级ATP内部模块功能, 可将其划分为主控制模块和外围设备.由于无线通信是C1级列控系统所有的功能, C0级不具备, 故将无线通信模块划分在C1控制模块内.外围设备根据其冗余方式可划分为冷备设备与热备设备.TCR模块, TIU模块, SDU模块为双系热备结构, 双系中任何一个故障, 系统仍正常运行; 而 BTM与DMI为双系冷备, 双系中只有一系工作, 可靠性分析只能作单系考虑.

1)构建模块级冗余ATP可靠性框图如图4所示.模块级冗余ATP系统中, 以功能模块为单位, 进行双系热备配置.模块间采用并串结构, 根据模块级冗余ATP建立的可靠性框图.

图4 模块级冗余CTCS-1级ATP可靠性框图Fig.4 Reliability block diagram of CTCS-1 ATP under the condition of modular redundancy

2)构建系统级冗余ATP可靠性框图如图5所示.系统级冗余设计以系统为单位, 进行冗余配置.系统级冗余设计对主控模块与外围模块分别冗余配置, 主控模块和外围设备间采用串联, 最终实现整个系统的系统级冗余配置.

图5 系统级冗余CTCS-1级ATP可靠性框图Fig.5 Reliability block diagram of CTCS-1 ATP under the condition of system redundancy

3.2.2 ATP增强型BN模型建立

增强型BN网络通过引入故障关系“ AND” , “ OR” , 使其具有故障树的特点, 可根据系统可靠性框图, 构建增强型BN模型.由3.2.1节CTCS-1级ATP可靠性框图中模块间串并关系、模块冗余关系, 直接建立模块级和系统级ATP系统增强型BN模型, 如图6和图7所示.

图6 模块级冗余CTCS-1级ATP增强型贝叶斯网络模型Fig.6 Enhance BN model of CTCS-1 ATP under the condition of modular redundancy

图7 系统级冗余CTCS-1级ATP增强型贝叶斯网络模型Fig.7 Enhance BN model of CTCS-1 ATP under the condition of system redundancy

4 CTCS-1级ATP 可靠性评估

目前, CTCS-1列控系统需求规范仍在编制阶段, 无法根据其标准对CTCS-1级ATP的RAM指标进行评估, 但和利时、通号设计院等单位的CTCS-1级ATP均是在CTCS-3级ATP硬件平台上开发的, 两者元器件基本相同, 软件架构相似, 可靠性指标相近, 故CTCS-3级列控系统需求规范(SRS)可作为CTCS-1级ATP的RAM 指标评价标准.列控系统需求规范要求车载ATP 设备RAM指标如下[5, 9] : 1)可靠性指标 TMTBF≥ 105 h, TMTBF为平均故障间隔时间( Mean Time Between Failures , MTBF); 2)可用性指标:A≥ 99.99%; 3)维修性指标TMTTR≤ 10 h, TMTTR为平均故障维修时间(Mean Time to Repair , MTTR).

列控车载设备基本单元寿命符合指数分布, 基本单元RAM指标计算如下:

单个基本单元可靠度为

R=e-λt(5)

可用度为

A=TMTBF/(TMTBF+TMTTR)=μ/(λ+μ)(6)

不可用度为

U=1-A=1-μ/(λ+μ)=λ/(λ+μ)(7)TMTBF=1/λ(8)TMTTR=(TMTBF/A)-TMTBFTMTTR=1/μ(9)

式中:λ 为失效率; μ 为维修率.

本节可靠性分析中所采用的基本单元可靠性参数(λ μ )来源于文献[5], 参考已知可靠性参数, 求解基本单元RUTMTTR结果, 如表1所示."* "标记的基本单元为双系冷备单元, 在故障发生时备用单元不能立即工作, 分析时作单系考虑; 其余备用单元在工作单元故障条件下能在很短时间内启用, 为双系热备单元.系统整体可用度数学模型为

P(A=0)=i=1nP(Ei=0)·P(A=0|Ei=0)(10)

式中:P(Ei=0))为基本单元Ei正常状态下可用度; P(A=0|Ei=0)为Ei正常情况下ATP系统可用度; 式(10)为贝叶斯全概率式, 由底层向上因果推理的数学模型, 据此可求解ATP系统整体可用度.

表1 基本单元RAM参数指标(t=2× 104 h) Tab.1 Basic units RAM index (t=2× 104 h)
5 仿真验证

本文借助仿真验证软件MSBNX进行CTCS-1增强BN模型的推理评估及可靠性验证.利用该软件对ATP增强型BN模型进行仿真, 在考虑维修情况下, 对ATP整体模型进行可靠性评估.CTCS-1级模块和系统级冗余ATP在MSBNX中可靠性评估结果分别如图8和图9所示.

图8 CTCS-1级模块级冗余ATP模型仿真及可用度计算Fig.8 Simulation and availability calculation of CTCS-1 modular redundancy ATP model

图9 CTCS-1级系统级冗余ATP模型仿真及可用度计算Fig.9 Simulation and availability calculation of CTCS-1 system redundancy ATP model

在图8中, 根据表2基本单元的可靠度R, 可求得模块级冗余ATP系统可靠度R=0.827 5.由式(5)得模块级冗余ATP失效率λ =-(ln R)/t=-ln 0.8275/(2× 104)=9.47× 10-6, TMTBF=1=1.06× 105 (h), 根据式(6)可得TMTTR=0.424 (h).

表2 CTCS-1级模块级和系统级冗余ATP的 RAM指标对比 Tab.2 Comparison of RAM indicators between CTCS-1 modular and system redundancy ATP

2)同理, 在图9模型中, 根据表2基本单元的可靠度R, 求得系统级冗余ATP系统可靠度R=0.818 9.由式(5)得系统级冗余ATP失效率λ =9.98× 10-6, TMTBF=1.00× 105 (h), 根据式(6)可得TMTTR=0.4(h).

CTCS-1级模块级与系统级冗余ATP RAM指标对比见表2.

通过与当前列控系统需求规范RAM指标对比可知[9], 模块级与系统级CTCS-1级ATP系统RAM指标均满足当前列控系统需求规范要求.由表2知, 模块级冗余ATP设备TMTBFR值均大于系统级冗余ATP设备, 模块级冗余ATP可靠度更高, 可用度基本相同, 由于两者平均维修时间相差很小, 且均远低于规定的10 h, 可维修性能基本相同.综合对比RAM指标发现, 两者维修性基本相同, 但模块级冗余的ATP设备可靠性更高, RAM指标更优.

6 CTCS-1级ATP薄弱环节分析

增强型BN作为一种不确定性的因果推理模型, 在定义模块间逻辑关系的基础上, 可在信息不完备的情况下修改.通过可以观察的已知随机变量推断不可观察的随机变量.借助ATP增强型BN模型逆向推理, 求解系统故障时, 基本单元的条件失效概率, 根据条件失效概率查找薄弱环节[10].ATP故障条件下, 基本单元条件失效率推理模型为

P(Ei=1|A=1)=P(Ei=1)·P(A=1|Ei=1)k=1nP(Ek=1)·P(A=1|Ek=1), i=1, 2, ..., n(11)

式中:P(Ei=1|A=1)为ATP故障时基本单元Ei故障率; 分子表示基本单元Ei失效条件下ATP系统故障率; 分母为在基本单元失效条件下ATP系统故障率之和.

图10、图11为模块级与系统级冗余ATP逆向推理仿真图.在假设系统故障情况下求解模块级和系统级冗余ATP基本单元条件失效率, 发现两种冗余设计方式中外围冷备设备条件失效率远高于其他模块, 是导致ATP设备故障的主要原因.

图10 CTCS-1级模块级冗余ATP逆向推理及基本单元条件失效率计算Fig.10 Backward reasoning of CTCS-1 modular redundancy ATP model and basic unit conditional failure rate calculation

图11 CTCS-1系统级冗余ATP逆向推理及基本单元条件失效率计算Fig.11 Backward reasoning of CTCS-1 system redundancy ATP model and basic unit conditional failure rate calculation

C1两种不同冗余方式下的ATP, 其外围冷备模块基本单元条件失效率基本相同, 由图10与图11知, 外围冷备模块中单元条件失效率:P(DMI=1|ATP=1)=0.661 35, P(BTM-Processor=1|ATP=1)=0.264 54, P(BTM-Ant=1|ATP=1)=0.074 07.冷备单元条件失效率排序均为:P(DMI=1|ATP=1)> P(BTM-Processor=1|ATP=1)> P(BTM-Ant=1|ATP=1).因此, DMI、BTM-Processor、BTM-Ant为这两种设计方案的薄弱环节, 是导致ATP故障的诱因, 建议DMI采用双机热备冗余方式配置、BTM主机采用片级冗余设计以降低外围冷备设备条件失效概率, 保证CTCS-1级ATP有足够高的可靠性与安全性.

7 结论

本文作者针对增强型BN在传统BN基础上引入故障逻辑门, 使其具备故障树的特点, 能根据系统可靠性框图, 直接建立对应的增强型BN模型.借助微软贝叶斯仿真工具MSBNX对模块级与系统级CTCS-1级ATP模型进行仿真及RAM指标计算, 得到的主要结论如下.

1) CTCS-1级ATP模块级冗余ATP 与系统级冗余ATP 的RAM指标均满足当前列控系统需求规范要求.两者可用性相同; 平均维修时间相差不大, 且远小于规范要求的10 h, 可维修性也基本相同.但模块级冗余ATP的平均故障间隔时间、可靠度、失效率等可靠性指标均优于系统级冗余ATP, 因此, CTCS-1级模块级冗余ATP整体RAM指标要优于系统级冗余ATP.

2)通过MSBNX仿真软件逆向推理CTCS-1级ATP模型发现, 外围冷备模块条件失效率远高于其他模块, 是导致模块级冗余与系统级冗余ATP故障的诱因.具体来说, DMI与BTM主机模块条件故障率较高, 为两种冗余方式下ATP设备的薄弱环节.建议设计人员在对CTCS-1级ATP设计时采用DMI双系热备冗余, 对BTM主机采用板级热备冗余, 以使CTCS-1级ATP整体可靠性与可用度达到最优.

The authors have declared that no competing interests exist.

参考文献
[1] 中国铁路总公司. 列控系统自主化关键技术研究—CTCS-1级列控系统关键技术研究合同[Z]. 2015.
China Railway Corporation. Research on the key technology for CTCS self-dependence-contract of CTCS-1 train control system key technology research[Z]. 2015. (in Chinese) [本文引用:1]
[2] 中国铁道科学研究院, . CTCS-1级列控系统总体技术方案(V0. 1)[P/OL]. [2015-11-16]. http: //wenku. baidu. com/view/35141a6f83d049649b6658f5.
China Academy of Railway Science, et al. Integral technical scheme of CTCS-1 train control system(v0. 1): Beijing[P/OL]. [2015-11-16]. http://wenku.baidu.com/view/35141a6f83d049649b6658f5. (in Chinese) [本文引用:4]
[3] CENELEC. Railway applications: the specification and demonstration of reliability, availability, maintainability related and safety : EN-50126-1998[S]. Brussels: CENELEC, 1998. [本文引用:1]
[4] CENELEC. Railway applications: safety related electronics systems for signaling: EN-50129-2003[S]. Brussels: CENELEC, 2003. [本文引用:1]
[5] 邸丽清, 袁湘鄂, 王永年. CTCS-3级列控系统RAM指标评价方法研究[J]. 中国铁道科学, 2010, 31(6): 92-97.
DI Liqing, YUAN Xiang’e, WANG Yongnian. Research on the evolution method for the RAM goals of CTCS-3[J]. China Railway Science, 2010, 31(6): 92-97. (in Chinese) [本文引用:3]
[6] 张文韬, 张友鹏, 苏宏升, . 基于动态故障树的CTCS-3级ATP系统可靠性分析[J]. 工程设计学报, 2014, 21(1): 18-26.
ZHANG Wentao, ZAHNG Youpeng, SU Hongsheng, et al. Reliability analysis on ATP system of CTCS-3 based on dynamic fault tree[J]. Chinese Journal of Engineering Design, 2014, 21(1): 18-26. (in Chinese) [本文引用:1]
[7] 李清. CTCS-2级列控系统安全可靠性分析及运用研究[D]. 成都: 西南交通大学, 2010.
LI Qing. Research on safety reliability and application of CTCS-2 train control system[D]. Chengdu: Southwest Jiaotong University, 2010. (in Chinese) [本文引用:1]
[8] 周忠宝, 周经纶, 金光, . 基于贝叶斯网络的概率安全评估方法研究[J]. 系统工学报, 2006, 21(6): 636-643.
ZHOU Zhongbao, ZHOU Jinglun, JIN Guang, et al. Probabilistic safety assessment research based on Bayesian networks[J]. Journal of Systems Engineering, 2006, 21(6): 636-643. (in Chinese) [本文引用:1]
[9] 铁道部科技司. CTCS-3级列控系统需求规范SRS(V1. 0): 科技运[2008]127号[S]. 北京: 铁道部科技司, 2008.
epartment of Science and Technology, Ministry of Railways. CTCS-3 train control system requirements specification (V1. 0): No. 127 of science and technology transport file[S]. Beijing: Department of Science and Technology, Ministry of Railways, 2008. (in Chinese) [本文引用:2]
[10] 尹晓伟, 钱文学, 谢里阳. 系统可靠性的贝叶斯网络评估方法[J]. 航空学报, 2008, 29(6): 1482-1489.
YIN Xiaowei, QIAN Wenxue, XIE Liyang. A method for system reliability assessment based on Bayesian networks[J]. Acta Aeronautica Et Astronautica Sinica, 2008, 29(6): 1482-1489. (in Chinese) [本文引用:1]