《大数据技术在主动配电网中的应用研究.docx》由会员分享,可在线阅读,更多相关《大数据技术在主动配电网中的应用研究.docx(3页珍藏版)》请在第一文库网上搜索。
1、大数据技术在主动配电网中的应用研究主动配电网实现主动运行和主动管理需要全景的配网状态数据。随着智能电网的建设,特别是用电采集系统、在线监控系统的实施和应用使电网公司的数据量达到PB级,进入大数据时代。如何高效利用这些数据实现与用户的互动,解决分布式能源消纳是当前的研究焦点。文章首先概述了当前主动配电网中的大数据类型及特点;然后分析了这些技术在主动配电网中可能的应用及挑战;最后结合主配电网在能量优化调度、状态分析评估、保护控制及需求侧管理方而的应用需求,对大数据技术可能的应用场景做了展望。O前言主动配电网中含有大量分布式电源与柔性负荷,网络规模大并且结构复杂,系统实际运行过程中通常表现出强互动、
2、多藕合、高随机的典型特征,运行过程中产生的数据结构多样、来源复杂,时间尺度不统一、空间尺度各异,具有典型的“4V”特征,即规模大、类型多、价值密度低和变化快。大数据技术在主动配电网中的应用,将为系统运行状态的实时检测与准确预测、系统运行状态的安全评估、系统运行优化控制提供有力的技术支持。大数据核心技术涉及数据的存储、整合、计算、应用4个层次。存储层涉及分布式文件存储、内存数据库、键值数据库、列数据库等技术。整合层涉及大数据连接器、流数据总线、PIG和HIVE等技术。计算层涉及并行数据处理、流式计算等技术。应用层涉及数据挖掘、自然语言处理和图像识别等技术。其中,大数据挖掘技术是用于海量异构主动配
3、电网数据处理分析的关键手段,包括聚类、估计、预测、相关性分组或关联规则、聚类、描述和可视化、复杂数据类型挖掘等方法。鉴于大数据在主动配电网中出现和应用的场景越来越多,有必要对目前的应用现状和面临挑战做出总结。为未来大数据技术在主动配电网中的应用提供有益的参考。本文从主动配电网中大数据的特征出发,依次综述了主动配电网中应用的大数据技术,并给出了主动配电网中大数据处理技术的应用方向。1主动配电网中的大数据及其特点1.1 主动配电网中的大数据主动配电网中的数据大致可以分为3类:主动配电网运行状态及相关监测信息,如网络运行拓扑、分布式电源及设备状态信息;影响分布式电源出力的配电网相关区域天气信息,如光
4、照、气温、风速等信息;网内用户的状态及营销信息,如电动汽车的运行信息、用户的用电量信息等。1.2 主动配电网中大数据的特点(1)数据规模巨大。国家电网信通公司在北京5个小区,部署了353个智能电表信息采集点,采集1.2万个参数,包括频率、电压、电流等,15min采集一次,一天就能产生34GB的信息。(2)数据类型繁多。数据从结构上来说,含有大量的结构化数据和非结构化数据;从数据应用种类上来说,涵盖电流、电压、电量等电气量信息,用于分布式电源出力预测的天气信息,用于分析电动汽车用户行为的用户行为记录信息等。(3)价值密度低。以状态监测量为例,对变压器、分布式电源等的连续不间断的监测信息中,只有极
5、少片段能反映设备不正常运行状态的信息为可用信息;电动汽车的用户数据中,一类用户若干年的充放电时间、电量、行驶区域等的大量数据中,仅能挖掘出一两条其使用行为特征。(4)变化速度快。主动配电网的运行状态并非恒定,由于分布式电源的出力不稳定以及负荷波动性较强,导致主动配电网的运行电气量信息、拓扑数据等都在时刻变化。有效存储并利用变化如此快的数据,需要研究相关的策略。2大数据处理技术及在主动配电网中的应用挑战2.1 数据管理技术目前最典型的大数据存储管理技术有2种:第1种是采用大规模并行处理关系型数据库,其采用MPP架构的新型数据库集群,重点面向行业大数据,再结合MPP架构高效的分布式计算模式,完成对
6、分析类应用的支撑,具有高性能和高扩展性的特点,在企业分析类应用领域获得极其广泛的应用。另一种是HadooP的非关系型数据库,其基于HadooP的技术扩展和封装,围绕HadoOP衍生出相关的大数据技术,目前最为典型的应用场景就是通过扩展和封装HadOOP来实现对互联网大数据存储、分析的支撑。2.2 数据分析技术数据分析技术包括数据挖掘、机器学习等人工智能技术,典型的如聚类、人工神经网络、支持向量机、粗糙集理论、决策树等技术。这些技术在电网安全分析、能源预测、设施线路运行状态分析等都有较系统的研究和应用。随着分布式电源、电动汽车等新型负荷及用户的出现,这些数据分析方法又再焕发新生。因为分布式出力的
7、间歇性、不确定性,以及与周围环境的强藕合,使得数据分析的难度大大增强。这些主动配电网中存在的特殊问题,都需要进一步利用数据分析技术进行研究。2.3 数据处理技术在数据处理技术中最典型的当属云计算技术,由于大数据的数据量和分布式的特点,使得传统的数据管理技术难以胜任这种海量数据。云计算的核心是海量数据存储和数据并行处理技术,其核心思想包括分布式文件系统和M叩RedUCe技术。分布式文件系统为部署在廉价PC上所设计,具有容错性高、可扩展性强的特点,可以为应用程序提供高吞吐量的数据访问,适合具有超大数据集的程序访问。M叩RedUCe,通过把对数据集的大规模操作分发给网络上的每个节点实现可靠性;每个节
8、点会周期性地返回它所完成的工作和最新的状态。2.4 数据展现技术数据展现技术具体体现为可视化技术、历史流展示技术、空间信息流展示技术等。数据可视化是可视化技术在非空间数据领域的应用,可以增强数据呈现效果,让用户以直观交互的方式实现对数据的观察和浏览,从而发现数据中隐藏的特征、关系和模式。可视化技术己被证实是一种解决大规模数据分析的有效方法,并在实践中得到广泛应用。主动配电网中数据可视化具有特殊的实现难度,其中数据类型种类繁杂,需要大力发展数据展现技术,提高电力数据的直观性和可视性,从而提升数据的可利用价值。3主动配电网中大数据处理技术的应用方向3.1 主动配电网能量优化调度方面的应用从数据分析
9、层面上,由于能量优化调度模型中需要整合多源数据信息。然而目前电网中各信息系统大多是基于本业务、本部门的需求,存在不同的平台、应用系统和数据格式,导致信息与资源分散,异构性严重,横向不能共享,上下级间纵向贯通困难。而大数据处理平台能够实现多源异构数据的存储和提取,并能大大提高数据存储容量,这将有效提高主动配电网能量调度系统的数据存储效率。从数据分析层面上来看,能量调度问题是一个多约束条件下的优化问题。其可行解的求取需要相关的数据挖掘算法配合支持,例如粒子群算法的应用。在主动配电网应用场景下的能量调度模型随着参与优化变量的增多,约束条件的增加以及网内能量双向流动的特性都将导致优化问题求解的难度加大
10、。因此,机器学习等数据挖掘算法将为该优化问题的求解提供可行的思路。3.2 主动配电网运行状态分析评估方面的应用分布式电源出力预测、短期负荷预测、设备状态监测以及作为特殊负荷的电动汽车的时空分布特性都是配电网状态评估的关键支撑信息。针对分布式电源的出力预测,可以利用关联规则聚类系统、基于关联规则的分类、关联决策树等数据关联规则挖掘方法,根据分布式电源出力与不同类型气象数据及周边区域不同气象站的关联特性。由于分布式电源出力的不确定性,主动配电网中的海量运行信息也将成为挖掘分布式电源出力概率描述的基础。由于主动配电网中用户能量双向流动的特点,绝大部分用户安装了智能电表,积累了海量的用采信息。基于现有
11、海量用采数据,采用大数据聚类分析方法对用户负荷按照稳定模式、波动模式、随机变化模式等进行分类,其次运用关联分析技术构建天气、口期等影响因素与负荷的关联关系,最后利用回归决策树分析方法,建立基于知识学习和规则挖掘的智能预测系统,用以提升短期负荷预测精度。3.3 主动配电网保护控制方面的应用分布式可再生能源大规模接入使得配网出现随机不确定双向潮流,同时主动运行与主动管理的要求也使得配网拓扑结构与运行方式更为灵活多变,两者都对安全可靠配网保护的实现提出了严峻的挑战。主动配电网中保护测量信息具有多源、多时间尺度的特点,因此,配网保护量测数据的自动关联与统一描述方法将是一个重要的研究方向。同时,多源多时间尺度数据的有效利用需要结合不同任务需求,兼顾多种数据分析任务的准确性与时效性。在故障特征分析方面,需要对海量、多源的历史故障录波数据进行深入挖掘,分析不同场景下主动配电网的关键故障特征,进而研究基于故障信息反馈的配网保护控制方案。4结语未来的主动配电网将是依托大数据处理分析技术的全景实时智能配电网。大数据处理平台具有低成木、扩展性强、高可靠性、并行分析等优势,但在实时性、数据一致性、隐私性和安全性方面仍有不少的挑战。大数据在电力领域的应用才刚刚开始,还需要电力企业和科研机构共同努力,相信主动配电网和电力大数据这2个电力领域的新兴概念将会在不久的将来焕发活力。