基于PCA-ALOCO-SVM模型的引风机状态预测及预警研究
扫描二维码
随时随地手机看文章
引言
如今,高参数、大容量火电机组比例不断提高,火电机组运行环境日益复杂,辅机设备数量众多。泵、风机和加热器等重要辅机一旦在运行过程中出现劣化或故障,将对设备性能产生严重影响,甚至引发重大经济损失。其中,引风机的运行状态显得尤为重要。实现引风机运行状态的精准预测有助于实时监测引风机的运行状态,提高机组运行的稳定性和效率,维护和保障火电机组的安全,并为后期维护和升级提供便利[1]。
郭鹏等[2]采用多元状态估计法,建立了一种用于正常运行状态下风电机组齿轮箱温度预测的模型,通过对生成的残差进行统计分析,确定适当的预警阈值,以进行故障预警。为研究风机齿轮箱故障预测问题,赵洪山等[3]提出了LSSVM方法,然而,这种方法的泛化能力相对较差,可能无法有效适应不同的情况。另外,王松岭等[4]提出了一种基于K—L变换的空间模式故障识别方法,用于实现风机多种故障的识别,然而,该方法并不属于早期故障预警范畴,无法提前发现故障。多元状态估计方法(MSET)是一种成熟的预测诊断技术[5],可以用于设备状态预测和故障诊断。基于多元状态估计技术进行建模预测,主要将过程记忆矩阵用不同算法加以改进,提升模型的预测精度,通过绘制残差曲线和设定阈值来实现早期故障预警[6]。此外,美国GE公司的EPI Center系统[7]也能够进行设备性能劣化曲线、回转设备轴承故障和信号传感器故障的识别,并在国内浙能集团得到试用。另外,肖成等[8]通过结合小波分析和BP神经网络方法,设计了一种高准确率的风力发电机故障诊断模型。此外,马博洋[9]提出了一种结合相关性分析和主成分分析(PCA)的方法来降维处理燃煤电站一次风机的监视参数,并利用MSET方法进行建模,取得了良好的效果。但上述各种方法均有一定的局限性,需进一步研究。
为此,本文提出一种基于PCA—ALOCO—SVM的引风机状态预测及预警模型。基于某电厂引风机实际数据,采用邻近均值等方法进行数据预处理;然后采用PCA对输入数据进行降维;接着利用ALOCO—SVM建立预测模型,并将LSTM和BP模型与该模型进行比较,以验证其有效性。
1理论模型
1.1 PCA模型
主成分分析(PCA)是一种重要的统计学方法,它可以在最小化信息损失的前提下,提取原始数据中的关键信息并用少数新指标代替原始指标,从而实现指标降维,并简化复杂问题[10—11]。同时,PCA还可以消除特征变量之间的相关性信息。其数学表达式如下:
式中:yi(i=1,2,…,m)为第i个主成分;Aji(i=1,2,…,m)为指标x协方差矩阵特征值对应的特征向量;zxj为样本z经过标准化后的j项指标。
1.2基于混沌蚁狮算法的支持向量机模型
1.2.1支持向量机模型
支持向量机(Support Vector Machine,SVM)是一种由Vapnik[12]提出的有监督方式的机器学习模型,它基于VC维理论和结构风险最小化原则,可以最大化地在特征空间中进行线性分类。此外,通过选择不同的核函数,可以将非线性的低维问题映射到高维,同时进行线性分割,得到最优的分类超平面。
1.2.2混沌蚁狮算法
蚁狮优化算法(Ant Lion Optimizer,ALO)是一种群体优化算法[13-14]。蚁狮优化算法随机选择蚁狮、蚁群,并在多个峰值函数中寻找未被发现的盲点。为了进一步提高搜索效果,本文结合混沌优化算法的遍历性,提出了一种基于混沌思想的混沌蚁狮优化算法(Ant Lion Optimizer based on Chaos Optimization,ALOCO)。
该算法的具体步骤如下:
1)参数初始化:对模型初始化参数进行Tent混沌映射初始化。
2)计算适应度值:基于目标函数,计算适应度值,然后选择适应度值排在前N个位置的个体作为精英蚁狮。具体定义如下:
式中:n(r)为寻优迭代过程中第r代精英的数量;R为迭代次数的最大值;nmin、nmax分别为寻优迭代过程中精英数量的最小值和最大值。
计算蚂蚁位置:假设Levy飞行变异机制计算蚂蚁随机游走后的位置,具体为:
式中:Antit、Ant+1分别为第i只蚂蚁第t次、第t+1次所在位置;λ为Levy行走的步长。
更新边界条件:利用精英库中的蚁狮,对蚂蚁的游走边界进行规范化。通过令蚂蚁在与其匹配到的精英蚁狮及父辈精英蚁狮群范围内随机游走,实现对蚂蚁游走上、下边界的更新。具体定义如下:
式中:ci,r、di,r分别为捕获第i只蚂蚁的第r次迭代的最小值和最大值;Ej,r为被选定的第j只精英蚁狮在第r次迭代的位置;cr、dr分别为第r次迭代的最小值和最大值。
5)更新适应度值:在上述几个步骤的基础上,再次计算全体种群对应的适应度值,并按从大到小的顺序进行排列,即:
6)更新迭代:以最大适应度值为标准,进行循环迭代,直到达到预设的迭代次数上限。
1.3 PCA-ALOCO-SVM模型
本文提出的基于PCA-ALOCO-SVM的引风机状态预测及预警模型建立流程如图1所示。
主要步骤如下:
1)数据采集及预处理:通过各种传感器收集引风机温度、压力等参数,并建立数据库。在此基础上,进行数据预处理。
2)输入向量降维处理:采用PCA进行降维处理。通过PCA,可以减少预测模型输入向量的维数,同时保留大部分信息,从而提高模型的预测精度。
3)训练预测模型:构建并训练ALOCO-SVM预测模型。ALOCO-SVM是一种结合了异常检测和支持向量机的预测模型,可以有效处理数据中的异常情况,并提高预测的准确性。
4)实例验证:对预测模型进行实例验证,这样可以验证模型在真实情况下的可行性,并对模型进行进一步改进和调整。
2工程实例分析
本文以西北地区某发电机组中引风机为研究对象,数据采集时间为2023年1月10日__12日,每隔1min采集一次。引风机状态的好坏并非是由单个变量所决定的,其主要受到各个部位的温度、压差等影响,通过实时在线监控系统获取到表1所示参数值作为输入、输出向量,其中,D1~D10为输入向量,D11为输出向量。
2.1数据预处理
在数据采集的过程中,首先需要解决数据丢失问题,为此,本文采用邻近均值法对其进行补充,从而减小误差。
数据采集装置在现场环境采集数据时会受到噪声等复杂环境的影响,致使采集到的数据出现峰刺或跳变现象[15]。为了消除噪声带来的影响,引入小波降噪方法对样本数据进行处理,具体公式为:
式中:λ为阈值;σ为噪声的标准差;N为数据长度;wj,k为小波系数。
对引风机运行状态样本数据进行降噪处理,其中引风机进口烟气压力降噪前后对比如图2所示。
根据图2,降噪后的数据曲线相比原始数据,在各个峰值和拐点处的突变现象减小,曲线呈现出更为平滑的特点,波动幅度也减小,并且与原始数据的接近程度相对较高,更能准确地描述引风机进口烟气压力的变化趋势。
为消除11个不同向量的影响,采用min—max标准化方法对样本数据进行了归一化处理。具体的计算公式如下:
2.2 PCA降维处理
通过PCA方法可知,KMO和Bartlett检验值分别为0.65和0.00,各因素之间具有相关性。具体分析结果如下:解释总方差如表2所示,主成分因子荷载矩阵如表3所示。
当主成分特征值大于1时,提取数目为3,其累计方差百分比即贡献率大于70%,可将该成分提出作为主成分。依据表3可构建3个主成分表达式如下:
2.3预测模型构建与预测结果分析
采用emax、MAPE以及RMSE来表征各预测模型预测结果的准确程度,其具体计算公式为:
三个指标的值越小,说明预测模型的预测结果越准确。
为进一步验证所提PCA—ALOCO—SVM模型的优越性,将其与PCA—LSTM和PCA—BP预测模型进行对比,不同预测模型的预测结果如图3和表4所示。
根据图3显示,基于PCA—ALOCO—SVM的预测模型所得到的引风机入口烟气压力预测值与实际值整体拟合性更好,相比其他预测模型,它的预测结果更接近真实的引风机入口烟气压力值。表4表明PCA—ALOCO—SVM预测模型的运行时间最短,仅为39.38 s,且其emax、MAPE值和RMSE值均低于其他预测模型。与PCA—LSTM和PCA—BP预测模型相比,其emax值分别降低了16.96%和32.25%,MAPE值分别降低了19.13%和27.98%,RMSE值分别降低了18.26%和20.99%。这说明构建的PCA—ALOCO—SVM预测模型具有良好的预测性能,尽管存在一些数值上的误差,但这些预测误差是可以接受的。
3结论
1)本文基于火电机组实时监测系统所采集的数据,利用邻近均值法、小波降噪和归一化处理对所采集的数据进行预处理,保证了数据的完整性与可靠性。采用PCA对影响引风机入口烟气压力值的11个因素进行降维处理,提取出3个主成分,减少了预测输入集的维度,提高了ALOCO—SVM模型预测精度。
2)通过将PCA引入ALOCO—SVM、LSTM和BP预测模型中得知,本研究构建的PCA—ALOCO—SVM模型的预测结果与试验数据基本一致。与其他两个预测模型相比,PCA—ALOCO—SVM模型的平均绝对误差和均方根误差等评估指标都小于其他模型,这验证了本研究构建的组合模型具有较高的拟合度和预测性能,可以满足实际火电厂生产活动的需求。