安全仪表系统:为什么你设计的SIS总在误停车?一位老工程师的实话

又是一次凌晨三点的电话。操作班长声音都在抖——‘整套装置停了,连锁信号全都正常,可就是……就是根本没危险。’我盯着屏幕上那条直挺挺的停车曲线,血压瞬间冲上头顶。又被SIS误动作了。瘫在床上翻来覆去,突然想起几天前在项目上看见的那套系统:逻辑解算器上贴满调试标签,表决电路跳线乱得像蜘蛛网。说实话,那瞬间我真想把设计图纸揉碎了砸过去。

但话说回来,SIS出问题,能全怪维护吗?多半是设计阶段埋下的雷。很多人以为安全仪表系统就是一堆传感器加一个 PLC 配上继电器,只要 SIL 等级够了就万事大吉。❗ 大错特错。我见过最离谱的项目——一个每天处理上万立方天然气的脱水站——居然把两个安全功能挤进同一块逻辑解算器,还没做任何独立性评估。审核时对方项目经理振振有词:‘我们选了 SIL3 的控制器,够安全了吧?’ 我当时直接反问:你测过共同原因失效吗?冗余电源走的还是同一路母线!

被神化的 SIL 等级:证书不是万能药

拿到一张 TÜV 或 exida 认证的 SIL 证书,就以为系统固若金汤。这种思维简直像拿着驾照就敢开 F1。SIL 等级是整个安全功能的完整性,不光是那个黑匣子。传感器、逻辑解算器、最终元件……串联起来,可用性要一个一个算。有次我复核一套紧急停车(ESD)回路——压力变送器用的是普通工业级,电磁阀也毫无诊断。用户却指着逻辑解算器说:‘我们 SIL2 啊。’ 我差点一口气没上来。💡 记住:回路里任意一个组件拖后腿,整体 SIL 就要降级,甚至归零。

更讽刺的是,过度追求高 SIL 反而会惹来误停车。为了达到 SIL3,设计人员往往堆上三重冗余加 2oo3 表决,觉得单元越多越安全。然而表决电路本身也有失效概率,诊断覆盖率如果跟不上,假跳机率翻倍增长。我曾在东北一家炼厂亲眼看到,一套加氢裂化装置一年内因安全联锁误动损失上千万——其中七次触发都是因为某台冗余变送器信号漂移,两路偏差超限,硬生生三取二跳机。操作主管苦笑着跟我说:‘我们宁可它是真的漏了,反而心里踏实。’ 这种无奈,做过现场的人才能体会。

石化装置安全仪表系统传感器冗余安装现场
石化装置安全仪表系统传感器冗余安装现场

表决与冗余的陷阱:你以为的可靠,其实是脆弱

聊到冗余,我就停不住想吐槽。‘1oo2 不够安全?那就 2oo3;再不行就 2oo4D 带诊断……’ 仿佛表决结构是乐高积木,随便拼。实际操作中,多数人根本没算清楚平均失效时间(MTTF)和诊断覆盖率(DC)之间的非线性关系。冗余确实降低安全失效概率,但会抬高误停车率。尤其是共因失效没处理好,双通道同时被干掉,什么表决都白搭。我认识一位退休工程师,他管了一辈子仪表,说了一句让我记到现在的话:‘别总想着加通道,先把布线路径、电源隔离和定期测试做扎实。’

针对于此,问:

问:我们装置改造,现有 1oo1 架构,想提升到 SIL2,直接改成 1oo2 可以吗?

答:绝对不行。如果你直接把单通道翻成双通道而不改变任何诊断或测试策略,安全完整性确实提高了,但误停车率却可能飙升三到四倍。1oo2 架构下任一通道跳闸就会触发安全动作,两个传感器故障概率叠加。要压住误停车率,必须配合高诊断覆盖率、完善的旁路管理以及定期旁路测试。否则你会发现自己从‘偶尔误停’变成了‘周周误停’。

更隐蔽的坑是所谓‘同型异构’。同一批次、同一固件版本的变送器,共因失效概率高得离谱。我曾力推在一个环氧乙烷罐区使用不同品牌差压变送器做异种冗余,虽然采购部嫌麻烦,但投产三年,一次误跳都没有。说到底,冗余不是数量的堆砌,而是故障模式的多样性

看不见的手:工程实践里的魔鬼细节

设计图纸再完美,到了现场常被一顿乱改毁掉。比如电缆屏蔽层接地,我见过一个经典案例:SIS 数字量信号和电机变频器电缆挤在同一桥架,虽然分束敷设,但接地汇流排竟共用了一段。每次大泵启动,逻辑解算器就瞬间收到一串脉冲噪声……结果当然是‘莫名停机’。调查时电工还一脸无辜:‘我按图施工啊。’ 可图纸上根本没标接地拓扑!

功能安全工程师检查SIS逻辑解算器接线
功能安全工程师检查SIS逻辑解算器接线

还有测试间隔。几乎每本功能安全标准都强调检验测试(Proof Test)的重要性,可多少工厂真在认真执行?一次出差到西南,用户拍着胸脯说‘每半年测一次’。细聊才发现,他们的测试就是把逻辑解算器自检灯看一眼,阀门连锁根本未验证全行程。这种自欺欺人的测试,换来的是虚高的 PFDavg(需求时平均失效概率)——万一出事,系统连动作都动作不了。我当场在报告里写下:检验测试覆盖率不足15%,实际SIL等级已退化至等级1以下。 字字带血。

问:

问:我们想远程做部分行程测试(PST),减少下现场风险,但领导质疑可靠性,该怎么说服他?

答:这个质疑很合理。部分行程测试确实不能完全替代全行程检验,但它能探测到大概 70% 的阀门危险失效模式,比如阀杆轻度卡涩、定位器响应迟滞。✅ 关键是把它当成补充手段而非唯一手段。你可以参考 IEC 61511-1 条款 16.3,明确允许在安全仪表功能中使用在线诊断和部分行程测试来提高诊断覆盖率。结合厂家提供的诊断数据,重新计算 PFDavg,用数字告诉管理层:这样能把全行程测试间隔延长最多两倍,既减少维护风险又保持 SIL 等级。

说到计算,现在很多设计院用软件一键出结果,可输入参数大多来自数据库默认值,而非现场特定数据。比如环境因子、机械振动影响,根本没修正。结果就是纸面 SIL 漂亮,实际大打折扣。我经常劝年轻人:别太信软件,拿着仪表手册和失效数据库一个个核对。花三天时间,总好过出事赔三十年。

跳出数字陷阱:可用性与故障容忍

跳出数字陷阱:可用性与故障容忍
跳出数字陷阱:可用性与故障容忍

SIS 从来不是孤岛,它和基本过程控制系统(BPCS)紧密互动。很多误停车根源在于二者界限模糊。我见过最离谱的一次,操作员为了绕开一个频繁引发的 ESD 信号,竟然在 BPCS 里写了一段强制旁路程序——而这个 BPCS 本身与 SIS 共享了同一个现场传感器。看到控制逻辑的时候,我后背一阵凉意。这等于完全撕掉第一层保护,直接让装置裸奔。安全仪表系统一定要独立于 BPCS,这不是建议,是硬规矩。可惜总有人喜欢挑战底线。

那到底该怎么平衡安全性和可用性?这几年我摸索出一套笨方法:先老老实实做 HAZOP 和 LOPA,诚实评估风险削减需求,不人为拔高 SIL,然后针对误停车场景单独做可用性分析。比如辨识出哪些连锁在开车或异常工况下容易误触发,增加允许抑制的时间窗口,但用严格的授权管理控制旁路行为。这需要管理层和技术团队都明白一个道理:好的 SIS 不是死板地切断危险,而是在不危及生命的前提下,给操作员留一点反应余地。工业化不是赌命,而是智慧妥协。

最后想对同行的年轻人说一句:别被天花乱坠的术语唬住,安全仪表系统的核心就两样东西——靠谱的失效数据,和清楚的风险意识。图纸会画,程序会写,但如果心里没绷着那根弦,任何一个螺丝松动都可能变成事故前奏。夜深人静时翻翻事故调查报告,比看十本手册都管用。毕竟,我们做的每一道连锁,背后都是活生生的人。

免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。如有侵权请联系删除。
文章名称:安全仪表系统:为什么你设计的SIS总在误停车?一位老工程师的实话
文章链接:https://www.zystgy.cn/a/52517