当前位置:首页 > 工业控制 > 《机电信息》
[导读]摘要:以2000一2010年宁夏用电量相关资料为基础,提取用电量的影响因子,并于Rstudio平台构建基于随机森林算法(RF)的预测模型,对2012一2017年用电量进行预测验证。结果表明,模型输出值与实际值相吻合,训练误差与预测平均误差分别为7.02亿kw·h、9.20亿kw·h,该算法模型有效。对比可知,RF模型的MAE、RMsE(9.20亿kw·h、10.57亿kw·h)小于RBF(13.24亿kw·h、14.04亿kw·h)和sVM(22.39亿kw·h、25.57亿kw·h)模型,基于RF的用电预测模型效果更优。另外,RF能够准确计算预测因子的重要性,这对于变量筛选具有重要意义。

引言

电力资源是社会经济与民生发展的战略支撑性资源之一,电网系统面向全国各种用电用户提供可变的标准电能。由于当前各行各业对电能的依赖性增强,加之居民生活水平提高产生了更大的电能消费需求,用电量具有多结构化、变化复杂的特点,这对准确预测用电量提出了挑战。用电量预测能为电力供需负荷平衡、电力供应调配提供信息基础,对减少供电成本、提高电能质量具有重要意义。

近年来,随机森林方法在分类和回归问题中得到了广泛应用,该算法能处理高维数据,并检测维度间的相互关系,通过自主学习、高维映射、容错、记忆等手段大量挖掘隐含信息,得出用电量变化的内在规律。

鉴于此,本文以宁夏用电量为算例,采用RF方法构建电量预测模型,并检验该模型的优越性,以期为电力大数据挖掘和智能电网建设提供参考依据。

1算法原理

1.1随机森林原理

随机森林(RandomForest,RF)是集成多棵决策树模型(h(X,9k),k=1,2,…)而形成的融合算法[5]。该算法借助随机子空间和自助聚集理论,运用bootstrap方法从全部特征变量属性中进行随机等概率地放回抽样,对每个bootstrap样本构建决策树,通过打分寻找得分最高结果作为分类或回归的结果。其先利用bootstrap抽样从原始训练集7=((x1,y1),(x2,y2),…,(xn,yn))中抽取n个样本,记作训练集7l,进行k次抽样,则有k个独立样本形成的训练集(7l,l=1,2,…,k)。然后对各bootstrap训练集构建决策树组合模型,对于单棵树,从随机选择的m个属性中选出最优属性进行分裂。生成的单棵树模型即为独立领域的专家,组合k棵树中得分最高的类别即为预测的结果。

1.2多元协变量获取

单纯以历史用电量信息作为前向预测的依据,在模型迭代过程中其依赖的信息较少,可能会损失局部预测的细节信息,进而影响模型精度。而采用多元协变量为输入变量,以不同维度因子的变化特征描述用电量的时序变化趋势,既能够保证模型预测所需要的丰富的特征信息,还能够确保模型稳定性。结合前人的研究经验,从经济发展、人口、社会需求、自然环境等方面考虑,给出了相关的备选变量,如表1所示。

1.3数据来源与处理

指标数据的时间域为2000一2017年,从《宁夏统计年鉴》和《中国统计年鉴》中提取指标原始数据(表1)。采用MicrosoftExcel2016软件进行数据整理,Rstudio1.0进行建模预测分析,采用绝对平均误差(MAE)和均方根误差(RMsE)对模型精度进行评价。

2应用实例

2.1变量设置与参数优选

以2000一2011年的数据为训练样本,2012一2017年的数据为检测样本,两类样本中解释变量作为输入值,用电量数据作为输出值,在Rstudio1.0平台上调用RandomForest程序包进行编程实现。RF模型存在nlree和mlry两个敏感参数,其中nlree影响着模型泛化、收敛速率,mlry主要对节点分裂属性赋值起重要作用。通常认为,mlry最优取值为变量的方根值,而nlree的筛选通常采用网格搜索法进行。多次试验表明,mlry为5时模型错误率相对较小,进而确定mlry为5。随着nlree的变化,模型错误率表现如图1所示,可知当其为200以后,模型错误率较小而平稳,遂设置nlree为500。

2.2预测结果与精度比较

图2和表2分别为RF算法计算得到的训练和测试样本的预测结果,为比较算法优越性,另使用RBF(径向基神经网络)、sVM(支持向量机)实施建模预测。由图可知,3种不同算法均能够较好拟合用电量变化,训练样本各年份用电量预测的MAE介于2.33~45.38亿kw·h之间,表明训练模型精度可靠。训练模型统计显示,RF、sVM、RBF训练模型的MAE依次为7.02亿kw·h、7.72亿kw·h、8.86亿kw·h。测试结果表明,基于RF的预测结果最优,其MAE仅为9.20亿kw·h,RMsE为10.57亿kw·h,而基于sVM和RBF的预测结果的MAE和RMsE分别为22.39亿kw·h、25.57亿kw·h和13.24亿kw·h、14.04亿kw·h。综合来看,基于RF的用电量预测模型精度高、预测效果良好。

2.3解释变量重要性分析

RF算法通过袋外数据的误差表征变量特征,其值越大,表明该变量对模型的重要性越大[5]。由图3可知,平均气温、雨日数、人均GDP、工业产值电耗、人均用电量、第一产业用电量、GDP的分值最大,其重要性分值在4~5.53之间,表明其对模型精度具有重要影响:无霜期、极端低温天数、8月份平均气温、第三产业用电总量、1月份相对湿度和第二产业用电总量的重要性分值最小,介于0~1.03之间,说明其对模型增益效果较低:其他变量的重要性分值介于2~4之间,它们对模型精度的影响性一般。

3结论

以多元协变量为基础构建中长期用电量的预测模型,根据模型运行结果,得出结论如下:

(1)RF算法能够较好地拟合2000一2017年宁夏年度用电量变化,训练误差与预测误差均较小、精度可靠,表明预测方案应用性较好:

(2)多元协变量之间关联复杂,而RF能排除多维数组间共线性影响,拟合其与用电量之间的线性、非线性关系,并识别各协变量对模型精度的影响:

(3)随机森林集合了多个弱分类器,较于传统RBF和sVM算法其具有一定的优势,在建模过程中模型参量调试简易,模型稳定性高。

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

LED驱动电源的输入包括高压工频交流(即市电)、低压直流、高压直流、低压高频交流(如电子变压器的输出)等。

关键字: 驱动电源

在工业自动化蓬勃发展的当下,工业电机作为核心动力设备,其驱动电源的性能直接关系到整个系统的稳定性和可靠性。其中,反电动势抑制与过流保护是驱动电源设计中至关重要的两个环节,集成化方案的设计成为提升电机驱动性能的关键。

关键字: 工业电机 驱动电源

LED 驱动电源作为 LED 照明系统的 “心脏”,其稳定性直接决定了整个照明设备的使用寿命。然而,在实际应用中,LED 驱动电源易损坏的问题却十分常见,不仅增加了维护成本,还影响了用户体验。要解决这一问题,需从设计、生...

关键字: 驱动电源 照明系统 散热

根据LED驱动电源的公式,电感内电流波动大小和电感值成反比,输出纹波和输出电容值成反比。所以加大电感值和输出电容值可以减小纹波。

关键字: LED 设计 驱动电源

电动汽车(EV)作为新能源汽车的重要代表,正逐渐成为全球汽车产业的重要发展方向。电动汽车的核心技术之一是电机驱动控制系统,而绝缘栅双极型晶体管(IGBT)作为电机驱动系统中的关键元件,其性能直接影响到电动汽车的动力性能和...

关键字: 电动汽车 新能源 驱动电源

在现代城市建设中,街道及停车场照明作为基础设施的重要组成部分,其质量和效率直接关系到城市的公共安全、居民生活质量和能源利用效率。随着科技的进步,高亮度白光发光二极管(LED)因其独特的优势逐渐取代传统光源,成为大功率区域...

关键字: 发光二极管 驱动电源 LED

LED通用照明设计工程师会遇到许多挑战,如功率密度、功率因数校正(PFC)、空间受限和可靠性等。

关键字: LED 驱动电源 功率因数校正

在LED照明技术日益普及的今天,LED驱动电源的电磁干扰(EMI)问题成为了一个不可忽视的挑战。电磁干扰不仅会影响LED灯具的正常工作,还可能对周围电子设备造成不利影响,甚至引发系统故障。因此,采取有效的硬件措施来解决L...

关键字: LED照明技术 电磁干扰 驱动电源

开关电源具有效率高的特性,而且开关电源的变压器体积比串联稳压型电源的要小得多,电源电路比较整洁,整机重量也有所下降,所以,现在的LED驱动电源

关键字: LED 驱动电源 开关电源

LED驱动电源是把电源供应转换为特定的电压电流以驱动LED发光的电压转换器,通常情况下:LED驱动电源的输入包括高压工频交流(即市电)、低压直流、高压直流、低压高频交流(如电子变压器的输出)等。

关键字: LED 隧道灯 驱动电源
关闭