手机版
您的当前位置: 明翰范文网 > 范文大全 > 公文范文 > 数据挖掘在黄壁庄水库调度管理中的应用研究

数据挖掘在黄壁庄水库调度管理中的应用研究

来源:网友投稿 时间:2023-07-06 11:50:05 推荐访问: 数据挖掘 数据挖掘工程师岗位职责 数据挖掘工程师工作内容(19篇)

□肖伟强

科技创新

数据挖掘在黄壁庄水库调度管理中的应用研究

□肖伟强

以黄壁庄水库为例,将数据挖掘技术应用在水库调度中,采用决策树算法,探索数据之间的关联和规则,挖掘海量数据潜在的、有价值的信息及相关规律,更直观、便捷、高效地为黄壁庄水库调度提供决策参考,有助于提升水库运行管理水平。

数据挖掘;
调度管理;
应用研究

黄壁庄水库经过60多年的调度运行管理,积累了大量工情、雨情、水情观测数据及管理调度信息,但存在数据类型多且复杂、处理方式单一、数据资源利用率低等问题,未能将大量数据进行提取、利用、研究。对此,我们利用数据挖掘技术,采取决策树算法,对海量数据进行分析研究,发现其潜在的、有价值的调度管理规律。采用该技术可以更直观、更便捷、更高效地为黄壁庄水库调度提供决策依据,能够提升水库控制运用整体管理水平。

黄壁庄水库是海河流域子牙河系滹沱河上的重要控制性大(I)型水利枢纽工程,水库以防洪为主,兼顾灌溉、发电、工业及城市生活供水等,总库容12.1亿m3。建库以来,水库发挥了巨大的经济效益和社会效益。对于水库而言,经过几十年的运行管理,积累了海量数据,这些数据蕴含着十分有价值的信息。

水库调度运行过程中会产生庞大的数据,在进行数据挖掘之前,需要筛选并整理有价值的资料组成基础数据集,现得到黄壁庄水库1980年—2021年数据,并将数据资料和调度结果作为基础数据集。黄壁庄水库调度的基础数据集包括水库出入库流量、库水位、降水量、多年调度情况等。数据整理后以2021年为例,结果如表1所示。

表1 2021年黄壁庄水库基础数据集

在对黄壁庄水库调度数据进行整理后,得到其供水任务和供水次序。供水任务主要分为石家庄城市生活用水、西柏坡电厂发电用水、农业灌溉用水、石家庄民心河及滹沱河生态用水及其他临时性供水任务。在供水次序上,黄壁庄水库以优先满足石家庄市城市生活和工业用水为主,其次是河道生态用水,在保证其他供水的前提下,最后是农业灌溉用水。遇到特枯年份,水量不满足供水发生矛盾时,应优先保证城市居民生活用水。

3.1 决策树方法

决策树模型是一种常见的分类、聚类和预测方法,这种算法可以从一系列无规律性的案例中运用信息论原理,分析和总结样本属性,用决策树的方式推导出可供决策者参考的分类规则。目前,在决策树模型方法中,一般采用ID3和C4.5两种算法。

3.2 水库调度决策树模型的建立

水库调度规则是当前时段的决策变量(出库流量、出力、时段末水位)与影响因子之间的函数映射关系,即在当前状态已知的情况下,根据映射关系,通过水库当前状态,可以确定下泄流量、时段末水位等,即Y=F(X),其中Y为输出变量,即水库出库流量、末水位等;
X为输入变量,即水库前期调度状态等。对于水库调度规则的提取,即以实际调度运行管理数据为样本,对函数映射关系进行拟合,决策树的模型结构就是通过输入因子(当前入库流量、水位等)的取值范围,确定不同的决策变量取值。

对水库调度规则的提取,将采用C4.5算法进行计算,该算法的步骤大致为:首先将各属性进行离散分级,然后以某一个条件属性作为根节点,以该属性条件生成新的分支,之后按新的属性条件继续分割,直到节点所有样本数据属于同一类别,或没有其余属性进行分割,最终形成一个按照各种信息进行分类的水库调度规则决策树,具体决策树分类结构示意如图1所示。

图1 决策树分类示意图

对于水库兴利调度,选择可以反映调度本质的5个属性,分别为调度时段(月份)、入库流量、月初库水位、降水量、供水类别生成水库调度决策树,其中确定供水类别作为决策属性,其余为条件属性,这5个属性作为下一步数据挖掘的基本数据集。收集整理历史资料后,对水库历史数据的各属性针对不同条件进行离散分级,连续属性需要根据该属性多年数据分割成若干个等级,对于所选取的影响水库调度的5个属性来说,调度时段和供水类别为离散属性;
入库流量为连续属性,可根据具体资料进行处理;
月初库水位为连续属性,按照从死水位到兴利水位划分5个等级;
降水量为连续属性,根据多年降水量的数据集,按照一定频率进行分级。为了得到更好的结果,样本数据集应尽可能多,分级数目尽可能少(大约在2~10级之间)。

以黄壁庄水库为例,选取1980年—2021年的数据资料和调度结果(以月为调度时段)组成基础数据集,通过决策树C4.5算法从中提取水库调度规则。根据黄壁庄水库的特性,首先对各属性进行分级处理。

4.1 调度时段分级

调度时段以月为单位,由于每个月的来水量不同,调度决策亦不相同。黄壁庄水库所在区域6月进入汛期,7月—8月为主汛期,因此6月水库将开始腾库预泄,腾出库容为主汛期的强降雨做准备;
7月—8月在确保防洪安全的情况下进行供水、发电;
9月—10月属于汛期后期,来水逐渐减少,此时水库以蓄水为主,保证后期用水;
11月—来年5月径流量较小且趋于稳定。因此,将调度时段划分为:6月、7月—8月、9月—10月、11月—5月4个阶段。

4.2 入库流量分级

对于实时调度而言,入库流量需根据水文资料、预报信息等进行预测,准确的入库流量较难获取,因此通过长期历史资料采用聚类的方法进行分析,将入库流量分为枯、偏枯、平、偏丰、丰5个级别。

4.3 月初库水位分级

水库调度不同时期水位高低也会影响调度决策,黄壁庄水库死水位为111.5m,兴利水位为120.0m,将水库水位分为5个级别:111.5m~112.5m、112.5m~114.0m、114.0m~116m、116m~118m、118m~120m。

4.4 降水量分级

黄壁庄水库所在流域降水量年内分布不均匀,流域内多年平均降水量400mm~600mm,受季风影响,80%以上的降水量集中在6月—9月,其余月份降水较少。因此,按照调度时段的划分来进行降水量的分级处理,时段划分为6月、7月—8月、9月—10月、11月—次年5月4个阶段,每一调度时段降水量均分为1级、2级、3级。6月降水量分级依次为[0,40)、[40,60)、≥60;
7月—8月降水量分级依次为[0,50)、[50,100)、≥100;
9月—10月降水量分级依次为[0,20)、[20,40)、≥40;
11月—次年5月的降水量分级依次为[0,15)、[15,30)、≥30;

4.5 供水类别

供水以生活生产和农业灌溉为主,具体按照以下几种情况进行分级:能够满足供水,必要时可根据需要加大供水量为级别1;
能够满足农业灌溉和生活生产供水保证率时为级别2;
农业灌溉不能满足供水保证率,生活生产可满足供水时为级别3;
农业灌溉和生活生产均不能满足供水保证率时为级别4;
农业灌溉停止供水时为级别5。各属性分级处理后,整理后部分调度数据格式如表2所示。

表2 整理后的历史调度数据格式

最后通过决策树C4.5算法从黄壁庄水库1980年—2021年供水调度数据中提取调度规则,并将该方法封装在黄壁庄水库智慧管理平台中,调度规则通过图表形式展示,实现可视化展示和分析,如图2所示。从图中可以看出,不同调度时段,不同库水位所对应的调度决策不同,实际应用时,可根据输入的月份、库水位、预测的入流级别、降雨级别,得到对应的供水类别。通过系统平台的可视化展示,为水库兴利调度提供技术支撑,使数据更直观,决策更智慧。黄壁庄水库供水调度图见图2。

除兴利调度以外,将决策树算法应用在岗黄调度管理中,作为防汛调度管理的一部分。如图3所示,由于黄壁庄水库与岗南水库属于联合调度,因此需要分别考虑两个水库的水位情况,从而确定凑泄量。

图3  岗黄水库调度管理

将数据挖掘技术的决策树方法与水库调度相结合,基于决策树提取水库调度规则,研究表明基于决策树方法的水库调度规则,是通过大量数据挖掘而成,能够集中反映历史水文数据和调度数据的规律性,该方法将调度时段、入库流量、库水位等调度信息形成关联规则,得到的调度方案合理可行。在实际调度中,这一方法产生的调度规则具有简便、可操作性强等优点,能够直观、高效地反映水库控制运用中的规律性,便于管理者决策,对指导水库调度具有重要意义。□

2022-12-22

肖伟强,男,汉族,河北省水务中心黄壁庄水库事务中心,高级工程师。

猜你喜欢决策树数据挖掘供水四会地豆镇加快推进农村集中供水全覆盖源流(2021年11期)2021-03-25探讨人工智能与数据挖掘发展趋势大众投资指南(2021年35期)2021-02-16数据挖掘技术在打击倒卖OBU逃费中的应用浅析中国交通信息化(2020年1期)2020-07-27毗河供水一期工程四川水力发电(2020年1期)2020-03-06一种针对不均衡数据集的SVM决策树算法成都信息工程大学学报(2019年3期)2019-09-25决策树和随机森林方法在管理决策中的应用电子制作(2018年16期)2018-09-26基于决策树的出租车乘客出行目的识别中央民族大学学报(自然科学版)(2016年4期)2016-06-27供水产销差的组成与管控建议中国资源综合利用(2016年2期)2016-01-22一种基于Hadoop的大数据挖掘云服务及应用信息通信技术(2015年6期)2015-12-26甘肃引洮供水二期工程年内开建中国水利(2015年10期)2015-02-28

明翰范文网 www.tealighting.com

Copyright © 2016-2024 . 明翰范文网 版权所有

Powered by 明翰范文网 © All Rights Reserved. 备案号:浙ICP备16031184号-2

Top