模型市场
为广大工业用户开展数据模型的开发和业务的数字化转型提供参考。
随着中国民航业的快速发展,机场油库航油工业控制系统自动化程度及集成程度不断提高。工控系统测量采集了储油罐、输油泵、过滤器、输油管道等大量设备的运行数据。依据工控系统采集的设备运行数据,采用数据驱动的设备异常检测算法,能够及时的发现工控数据中存在的异常模式,提高设备运行与维护水平、提升服务质量、增强安全性和稳定性。成为油罐泄露、可燃气体泄露等专有安监系统的功能补充。
设备工控数据中的异常数据,主要表现为不同于正常数据的时序变化规律或不符合设备工作模式的设定,从而可以反映出:测量仪表故障、采集设备失效、传输网络受损、设备性能退化、质量问题或设计不足等问题。
在异常检测任务中,数据的真实标签往往缺失且难以获得。工控数据拥有大量无标签样本,因此选择的建模算法,宜采取建立在对数据分布有一些基本假设的无监督或半监督学习异常检测模型。
基于预测误差和基于重构误差的异常识别,是异常检测分析常用的两种技术路线。基于预测误差的算法框架是:根据 t 时刻之前的时间序列数据及状态等信息,通常是一个窗口的历史数据,预测 t 时刻的数据值,根据预测值与实际值的误差来判断该点数据是否异常。预测的长度可提前一步,或提前多步预测。基于重构误差的算法框架,是利用正常数据训练模型,对序列自身进行压缩和重构,获取正常情况下重构误差的统计水平,再基于对新的未知数据的重构误差的水平判定是否出现了异常。
基于误差重构。我们设计了三种自编码器模型。
卷积自编码器属于传统自编码器的一个特例,它使用卷积层和反卷积层(conv_transpose)或池化层替代了原来的全连接层。其基本结构编码器-解码器,分别采用一维卷积和一维反卷积层,实现良好的数据重构能力,提取数据的时序特征。
循环神经网络 RNN(Recurrent Neural Network)是一种深度神经网络结构,在时间维度上具有深层结构。因此,它常被广泛应用于时间序列建模中。相对于普通神经网络而言,它在每个时间戳 t,网络层接受当前时间戳的输入 xₜ 和上一个时间戳的网络状态向量 hₜ₋₁,经过变换后得到当前时间戳的新状态向量 hₜ。
与 RNN 只有一个输出状态向量的特点相比,LSTM 新增了一个内部状态向量,同时引入了门控机制,通过门控单元控制信息的遗忘和刷新。
数据来自某机场油库工业控制系统的 1 个月历史数据,采集频率 1 分钟,共 101 个测量点,覆盖储油罐、回收罐、加油泵、过滤器、变频器、总管等设备类型。现场反馈该阶段系统运行总体正常,但通过挖掘维保记录,发现对应阶段内现场发现少量传感器失效。 考虑到对异常的误报和漏报的重视程度是平衡的,尤其是在对安全等级要求较高的场景下,例如机场油库的设备异常,综合考虑准确率和召回率。
图中蓝色点为算法识别为正常的数据,红色点为算法识别为异常的数据