第一作者:燕飞(1980—),男,安徽怀远人,副教授,博士.研究方向为轨道交通系统安全保障和评估.email:fyan@bjtu.edu.cn
安全完善度等级(Safety Integrity Level,SIL)是标识安全相关系统安全性要求的重要概念,它主要是根据系统安全功能一旦失效可能造成后果的严重程度及事故的发生频率进行划分.在轨道交通安全相关产品的设计开发过程中,需要根据SIL的高低确定设计开发团队的组成和所采用的设计方法,系统的安全防护措施等.目前,我国轨道交通行业在应用SIL概念时,存在一些误区,比如认为SIL越高越好,把某个产品或是系统描述为可以达到某个SIL等级要求.本文基于国际轨道交通安全标准对于SIL的定义,澄清了一些错误使用SIL的概念,总结了安全完善度等级的划分原则和方法,方法包括定量和定性两种,并通过实例加以说明.
The Safety Integrity Level(SIL) is an important concept for safety related system to identify safety requirements. It is classified by the severity and frequency of the accidents caused by the failure of safety system. When designing and developing rail traffic safety related products, it is necessary to determine the developing team, their design methods and safety measures according to the level of SIL. Currently, there is some misunderstanding of the application of SIL concept in domestic rail transit industry. For example, some believe that the higher the level of SIL the better the product will be, and some describe a product or system as meeting the requirements of certain SIL. This paper describes the definition of SIL using international rail transit standard. It clarifies some incorrect use of the concept of SIL and introduces the definition, classification and determination methods of SIL, which includs quantitative and qualitative methods. Finally the paper illustrates these methods through application cases.
安全完善度等级(SIL)是描述安全苛求系统安全功能要求高低的重要指标, 是开展轨道交通安全苛求系统设计和评估工作的重要依据.在实际应用过程中, SIL又是最容易被误解或是错误使用的一个术语.
SIL这个概念需要和安全苛求系统所实现的安全功能相对应, 可是在表达SIL等级时, 通常会说某个产品或是某个系统达到SIL2或是SIL4级.有的时候设备供货商为了说明自家的产品安全质量水平高, 一味地宣传自己的产品能够达到SIL4级, 即最高安全等级要求, 还有的厂家将不涉及安全功能的产品宣传为满足某个SIL等级要求.这些错误使用SIL概念的情况不仅给大家带来了困扰, 还可能会影响我们国家轨道交通行业安全保障工作的开展.
为此, 本文作者认为非常有必要说明一下国际标准对于SIL是如何定义的, 应当如何正确使用SIL这个概念.
在欧洲各国家所实施的安全标准与技术之上, 结合IEC61508国际标准[1], 欧洲电工标准化委员会(CENELEC)制定了EN50126[2]、EN50129[3]与EN50128[4]等铁路安全防护标准.
要求在明确系统的定义后, 要辨识可能出现的危险.分析这些危险涉及的风险.随后, 辨识出危险控制措施:即安全措施, 安全功能或降低风险的措施.并为针对安全功能衍生出相应的安全需求.如何针对系统安全功能推导出这些要求, 过程中可能涉及安全完善等级的分配, 简称SIL.
在铁路领域, 存在不同的对SIL概念的理解和应用, 这可能会引起误解和误用.如SIL实际上对于运营商或供应商的含义是什么, 应当被应用到功能或系统元素, 或只等同于故障率等.
基本上, SIL应用于系统功能, 如安全相关系统实现的安全功能.SIL可由风险评估产出, 为后来在系统开发过程中使用.由运营商确定SIL, 把SIL作为容许的危险率(Tolerable Hazard Rate, THR)的区间, THR表示可容忍危险侧故障率.针对运营商制定具体一套措施和技术设备, 来实现预定安全目标.研发过程中, 可以理解为系统供应商对设计实现的系统安全完善水平的预测, 如图1所示.
而在CENELEC标准中, 将安全完善度定义为:在安全系统中保障系统安全的能力.SIL是其定量指标, 用来表现系统所要求的安全性完善水平.根据安全功能失效的频率及失效后产生危险严重程度将安全完善度划分SIL1-SIL4的4个等级, 不同等级的定量要求如表1所示.
![]() | 表1 安全完善度等级 Tab.1 Safety integrity level |
注意的是, 不同的自动化等级具有的不同的功能对应的安全要求, 这是风险分析和系统SIL分配的先决条件.
某一具体系统要求可以分为:安全要求和非安全要求.安全要求又分:安全功能要求和安全完善度要求.安全功能要求是指系统要实际实现的安全相关功能; 每个安全功能所要求的安全完善度等级则由安全完善度要求规定, 如图2所示.
安全相关功能完善性受系统失效、随机失效和外部影响三项因素影响[5].系统安全依赖于系统所采用的预防或容忍系统失效及控制随机故障的适当措施.要达到系统足够高的SIL, 需要兼顾系统失效安全完善度以避免系统失效, 随机失效安全完善度以控制随机失效, 从而保证系统安全性的实现.
1)系统故障完善度.
它在安全完善度中是一个非定量的部分, 它与系统的软硬件的系统故障有关, 通常是由整个生命周期内人为因素造成的.因此, 系统故障完善度是需要通过质量管理和安全管理来达到的, 同时在技术上给予相应的要求.
2)随机故障完善度.
它是随机故障相关的安全完善度的部分, 它是系统硬件可靠性的体现.随机故障完善度是通过安全技术措施达到的.随机故障完善度的定量评估就是进行系统风险和危害可能性的计算, 在计算前必须知道整个系统或设备的硬件器件的故障失效率和相应的故障模式.
英国黄页第4版[6]给出了冗余结构实现SIL的方案, 如表2所示, 前提条件是:低等级的功能物理上独立且使用了不同的设计原则; 如果其中一个较低等级的功能失效, 此连接器将抑制由此失效导致的所有危险源; 连接器需继承最高的SIL.
![]() | 表2 连接器机制可接受SIL分配表 Tab.2 SIL allocation for connector |
国际标准对于SIL概念定义为以下3点[7].
1)安全功能.一定要针对系统或是产品所实现的安全功能来描述SIL; 而在城市轨道交通信号系统招标文件中经常可以看到描述列车自动保护( Automatic Train Protection, ATP)的安全等级要求为SIL4.
2)量化指标.SIL是一个被定量化的指标, 使用THR来表达, 表示的是安全功能处于危险侧的概率, 但是这个指标不能与可靠性定量指标混为一谈; 有时候会错误的把可靠性中的平均故障间隔时间(Mean Time Between Failures, MTBF ) 和THR联系在一起; 当某个信号产品获得SIL4级证书后, 就认为这个产品各方面都是最好的.某产品安全性满足一定指标后就可认证获得SIL4级证书, 但还需要针对其可靠性、可用性和性能指标进行分析, 看它能否满足实际应用的要求.
3) SIL划分.SIL分为0到4级, 4级为最高, 但是并不等于说SIL4就是最好的, 这里没有高低之分, 只有适合与不适合.如果将SIL等级确定太高, 则要求在系统设计时采取更复杂、成本更高的技术来保证; 如果将SIL等级确定太低, 则系统的安全性达不到规定的要求.很多招标文件对于列车自动监督系统(Automatic Train Supervision System, ATSS)的要求为SIL2, 对于车门控制的要求甚至提升到SIL4.要知道SIL是对于系统安全功能的要求, 不能一味地把可用性和可靠性方面的要求强加到安全性方面.根据第1节的叙述, 可以了解到国际安全标准对于SIL4、SIL2和SIL0的要求差别很大, 不能随便更改.因为轨道交通领域的安全性更多的是通过故障导向安全或是紧急停车实现的, 这样列车可能在运行过程中因为很小的故障, 就紧急停车, 造成整个运营秩序被打乱.
在工程项目中有一些使用SIL概念的误区.在轨道交通行业.如一条线路的信号系统是由若干子系统组成的, 如果每个子系统的安全功能满足SIL4要求, 就认为整个信号系统就满足SIL4要求, 这也是对于SIL概念的错误认识.当某个产品获得SIL4证书, 说明其主要的安全功能可以达到SIL4所规定的要求, 不过当若干不同的产品组合在一起, 它们所共同完成的功能可能会发生变化, 这时需要进行系统性分析, 看看这时候的安全功能是什么, 它的表现如何.另外在一整条线路中, 设备的数量是很多的, 这时候不光要关注SIL, 更需要从整条线路的安全目标考虑, 分配给信号系统的安全目标是多少, 能否达到要求.如假设一个安全苛求系统是由10个满足SIL4安全功能要求的产品组成的, 每个安全功能的THR应小于10-8/h, 如果简单的去累加这些功能, 10个安全功能串接在一起, THR是累加的概念, 整个系统的安全功能的THR只能达到10-7/h, 也就是说只能满足SIL3要求, 因为这个系统当中的10个安全功能是各不相同, 不能够像可靠性指标一样进行计算.
还有一类SIL概念的错误使用误区, 就是将系统可靠性、可用性方面的要求用SIL进行表达.如现在大地铁的轨道交通运营压力都很大, 一旦发生故障, 线路很容易出现延误等影响运营的情况.为了提高轨道交通可用性, 会发现对于轨道交通通信、电源供电、人机显示功能等相关设备和功能提出SIL2要求, 这就是错误的把可靠性和可用性方面的要求用安全性的要求表达出来, 这不仅不能有效解决可靠性和可用性方面的问题, 反而会降低系统的相关性能, 为了提高系统的安全性, 往往会采用冗余和故障导向安全等技术手段.但为了保证安全性而增加系统组成的设备数量, 往往会降低整个系统的可靠性和可用性, 牺牲一些可靠性的指标要求.
对于任何安全苛求系统绝对安全是不存在的, 通过国际通行的原则(ALARP、GAMAB、MEM等)采用一定范围数字的方法来确定可容忍风险指标, 即什么样的危险可能性是能接受的.
1)可容忍目标.在铁路交通运输系统通常规定为
2)单点风险率.对每个风险进行估计, 可以用下式来描述单点风险率(Individual Risk of Fatality, IRF )
式中: Ni 是系统或设备特定功能的使用次数(每年或每小时); HRj 是风险模式下造成的危害率, 可以作为THRj 的参考值; Dj是系统或设备暴露在危险状态的时间; Eij 是系统或设备在故障状态的时间; $C^{k}_{j}$ 是风险模式的危害度; $F^{i}_{k}$是灾难事故的概率.
配合行业权威部门制订的单风险容忍度TIR, 计算出每个风险的IRF为
式中:单风险的THRi 就通过满足该目标可容忍度下的HR≤ THRi 得出.
取每个安全功能的THRn 中后最小值作为一个子系统或设备的THRs, 即
最终系统的SIL就可以对照标准的THR范围确定.
以列车运行控制系统完成的超速防护功能为例, 说明如何确定SIL.先设定列车运行控制系统的基本参数如下.
1)预估行驶中列车每小时遇到红灯的最大次数为4次, 每次遇到红灯进行处理的时间为100 s, 设备的处理周期为100 ms, 则ATP车载设备处理红灯安全防护功能的总次数为
2)车载设备强大的自检功能可以在出现故障时很快检测出, 并实施紧急制动使列车停车, 因此设定车载ATP设备处于危险状态的时间
3)由于车载设备出现安全故障, 则其危害程度将相当严重, 认定为将有10~100人处于危险之中, 则$C^{k}_{1}$=10-2, 同时对于严重危险和危害程度较大的风险, 认定$F^{k}_{i}$=1.根据式(1)、式(2)得出
要求上式满足, 则需要
通过和IEC61508的SIL表和EN50129的SIL表, 列车超速防护功能的SIL为SIL4.
以上只是对一个安全功能的计算和分配, 如果想得到整个ATP车载设备的评估, 必须对每个功能的THRi 和SILi进行分析.根据式(3)、式(4)的系统THRs和系统SILs确定整个车载ATP设备SIL的数值.
确定功能与子系统的对应关系, 找出每个子系统中功能的最高SIL, 将此SIL作为子系统的SIL.如表3所示, 子系统2包含安全相关功能F2、F4, F2为SIL2, F4为SIL4, 因此子系统2的SIL等级应当与F4的SIL相同为SIL4.
![]() | 表3 子系统SIL分配表 Tab.3 Allocation table of subsystem SIL |
IEC 61508标准采用风险图确定SIL等级:此方法是基于功能的风险水平确定SIL等级.功能的风险水平由公式R=f× C.其中, R是安全相关系统的风险; f是安全相关系统的危险源频率; C是危险源发生后果(后果可以是对于人的伤害、财产损失或是对于环境的破坏).
危险源频率
因此风险包括以下4个参数[8]:1)危险源后果C; 2)危险源发生频率和危险区域暴露时间F; 3)避免危险源的概率P; 4)非期望事故的概率W.
依据图3的风险图确定其风险减轻值, 取值可能是
![]() | 表4 W中各等级的定义 Tab. 4 Definitions of grades in |
![]() | 表5 参数定义 Tab.5 Parameter definitions |
计算机联锁系统是一个对于安全性要求很高的信号产品, 它通过列车进路、信号机和道岔直接的联锁关系保证列车行车的安全[9], 表6列举了联锁系统相关功能.
![]() | 表6 联锁功能列表 Tab. 6 Interlocking functions list |
以表6中的3.1.1.1办理列车进路功能为例说明确定SIL等级, 办理列车进路如果处理不当可能造成列车相撞等严重事故, 后果等级设定为C4, 非期望事故概率设定为W2, 通过图3得知这个安全功能的SIL等级应该划分为SIL4级, 如图4所示.
定性方法使用矩阵评估风险, 以文字方式而不是数字方式描述.如用类似“ 灾难性的” 或者“ 严重的” 之类的短语形容严重程度.定性的方法依赖于用户选择风险参数所基于的假设和判断.定性的方法可能会使用模棱两可的说明短语, 需要由次方法的不同的用户商讨得出共识.如“ 灾难性” 或“ 严重的” 的两个短语可以用来表示风险的严重程度的定义需要有度量标准.当选择了一个错误的风险参数时, 由于定性的方法使用一定范围和短语相结合粗略的描述风险参数, 在选错误数量级会立即导致不同的结果.
定量的方法使用明确的(或一定范围)的数字作为安全目标计算的输入.如危险出现的频率可以使用每小时的事件数表示.定量的方法可能更容易出现计算结果的错误.对于定量方法, 可能会出现参数的轻微变化, 并不一定会导致不同的结果.
但是, 无论什么方法, 如果无法准确估计参数, 应该选取保守的结果.此外, 过于复杂的应用计算或分析方法要求安全人员拥有更多的成功的应用的经验和诀窍.
本文作者基于CENELEC标准论述了安全完善度等级SIL概念和含义, 安全完善度等级蕴涵了每个等级对安全性的定量要求, 为系统安全设计和评估提供了依据.我们在应用安全完善度等级时需要首先识别出系统或是设备应完成的安全功能, 然后再去分析其SIL等级, 而不是泛泛的支出某个设备的SIL等级.本文给出的SIL等级确定方法来自于国际安全标准, 可以为安全管理和分析人员提供参考.
The authors have declared that no competing interests exist.
[1] |
|
[2] |
|
[3] |
|
[4] |
|
[5] |
|
[6] |
|
[7] |
|
[8] |
|
[9] |
|