更全的杂志信息网

基于数据分析的配电网故障数据特征变量提取

更新时间:2016-07-05

配电网运行可靠性是配电网运行维护工作的一项重要指标,直接关系到家家户户的用电可靠性[1-3]。现有研究工作中,对配电网可靠性的研究主要有配电网可靠性评估、配电网可靠性预测两种。配电网可靠性评估基于配电网结构和多年的元件可靠性参数历史数据为基础,对配电系统建立可靠性模型,利用评估算法求得配电网可靠性指标[4-5]。但是设备可靠性参数往往难以得到,且存在建模困难、计算量大的问题。配电网可靠性预测根据配电网历史可靠性指标的变化趋势应用灰色预测、回归预测和趋势预测等方法进行可靠性指标预测[6]。但其不能反映可靠性指标受相关因素的影响,有学者进一步研究了考虑相关因素为自变量、可靠性指标为因变量的预测的方法[7-8]。然而,可靠性指标不能够直观地感受实际的系统表现。在实际运行中,配电网运行人员希望采取更具有前瞻性的方法,能够预先判断配电网是否可能发生故障,从而在故障发生前采取有效措施。在此背景下,配电网故障预测应运而生。

馈线故障预测首先对所需的数据进行收集及预处理,进而获取完善有效的数据并基于所获得的数据进行预测模型的构建。其中,构建性能稳定、预测能力强的故障预测模型必须保证模型的输入特征变量是有效、强相关和无冗余的,目前研究工作中对输入变量的特征分析并无过多研究,只是笼统的将认为相关的变量作为输入变量,该做法可能造成信息冗余而影响预测模型。为此,基于配电网故障预测的科学性原则,本文首先对馈线故障影响因素的数据进行探索分析,发掘馈线故障及其影响因素之间的相关性,进一步地,将故障预测模型的输入特征变量进行分类,最终提出配电网馈线故障预测的特征变量集,以期提高配电网馈线故障预测的科学性。

1 馈线故障影响因素数据分析方法

本文通过数据探索的方法对馈线故障及其影响因素之间的关系进行分析,初步筛选出馈线故障影响因素特征变量(以下简称“故障特征变量”),为进一步采用特征选择算法筛选出最优故障特征变量奠定基础。

数据探索分析是通过绘制图表、统计、相关性分析、数据挖掘、大数据技术等方法探索数据规律的一种方法[9-11]。数据探索有三个特点:一是让数据“说话”,强调从数据出发,探索数据之间的内在规律,而不是传统的假设后验证结论。二是不拘泥与传统的统计方法,分析方法完全根据数据进行选择。三是数据分析结果倾向与采用数据可视化方法,直观地发现数据的内在价值。

在相关性分析方法上,本文采用皮尔森相关系数进行相关性定量分析[12-15]。假设变量X,其对应的另一变量为Y,则皮尔森相关系数计算方式如下。

(1)

1.健全统战教育教学体系。明确各级党校、行政学校、社会主义学院举办的各类班次的统战课程设置和课时要求;编制通用教材,供各地各类培训选用;加强统战专业师资力量的培养,培育、研发、推广相关精品课程,将统战课程上线党员干部网络学院,供广大党员干部自主学习。

蒲琳忍不住给张盈盈说了两任酷帅男友的奇葩事,张盈盈思索后说:“也不能一叶障目,再交往几个说不定能遇上好的呢。”

2 馈线故障的时间-地域特性

为进行馈线故障的特性分析,本文调研某地区120条馈线数据作为研究对象,基于这些馈线的数据进行统计、相关性分析。本节通过时间和空间两个维度,分析馈线故障在不同月份、不同地域上的差异性,并进行相关性分析,具体如下。

2.1 时间特性分析

为分析馈线故障与自身影响因素的关系,本节开展了馈线故障与设备投运时间、设备数量及分段绝缘导线/电缆总长度的相关性分析。

其中,变量XY的相关程度的划分为:|r|<0.4为低度线性相关,0.4≤|r|≤0.7为显著线性相关,0.7≤|r|<1为高度线性相关。

图1和图2分别给出了2014年1月至12月的月平均故障数直方图、2014年4月至2015年6月这14个月中120条馈线的第n月故障数与其n-i(i=1,2,3)月故障数之间的散点关系图。

1 馈线故障时间特性分析 Fig.1 Analysis of time feature for feeder outage

(a) (b) (c)

2 馈线故障自相关性分析 Fig.2 Self correlation analysis of feeder outage

从图1可知,馈线月平均故障数在7和9月最高、1和2月最低,在不同月份馈线月平均故障数具有差异性,馈线月平均故障次数的大小和时间存在关系。因此,将“故障时间”以月为单位作为一个故障特征变量,并依据不同月份对应的馈线月平均故障数的大小对月份划分等级,结果如表1。

从图2可直观看出馈线第n月故障数与第n-1、n-2、n-3月故障数存在相关关系,基于式(1)可得,图2(c)中馈线第n月故障数与其第n-i(i=1,2,3)月馈线故障数的线性相关系数|r|分别为:0.47、0.53、0.59,都为显著线性相关。因此,可初步将馈线第n-1、n-2、n-3月的故障数作为故障特征变量。特别说明的是,此处不进行更早之前的故障自相关特性分析,是因为这类故障自相关特性的特征变量之间存在互相关性,分析提取太多的特征变量会增加不必要的冗余特征。

1 故障发生时间分级结果 Tab.1 Classification results of outage occurrence time

月 份馈线月平均故障次数范围分级1、2[0,1)13、4、5、6、8、11、2[1,175)29、10[175,25)37[25,+∞)4

2.2 地域特征性分析

因不同馈线所属变电站对应的地域条件存在较大的差异,所以本文采用特征变量“馈线所属变电站”使得馈线地理特性特征化,并绘制已收集数据中的19个变电站的馈线月平均故障数直方图如图3所示。

Economic Policy Uncertainty and Growth Divergence between State-owned Investment and Private Investment in China

2 馈线故障地理特性分析 Fig.2 Analysis of the geographical feature for feeder outage

由图2可知,不同的变电站所对应的地域条件下馈线月平均故障数具有较大的差异,馈线故障发生情况存在地域差异特性。因此,将“馈线所属变电站”作为故障特征变量,并依据变电站所对应的馈线月平均故障数的大小对“馈线所属变电站”划分等级,结果如表2所示。

2 馈线故障地理特性分级结果 Tab.2 Classification results of geographical feature for feeder outage

变电站编号馈线月平均故障次数范围分级5、9、14、18[0,05)12、4、7、15、16、17[05,1)21、6、11、12、13[1,2)33、8、10、19[2,+∞)4

3 馈线故障的外部环境影响因素

在馈线故障与外部影响因素的关系分析中,外部影响因素主要指的是外界气温及恶劣天气(如降水、雷暴、大风等)的影响。分别分析如下。

中国南方电网有限责任公司科技项目:(GZKJXM20170191)

3.1 外界气温与馈线故障的相关性分析

统计降水量、雷暴日、大风日三类恶劣天气特征不同等级下120条馈线2014年1月至2015年6月的月平均故障数,绘制直方图如图5。

4 馈线故障与温度特征变量的关系分析 Fig.4 Analysis of relationship between feeder outage and temperature feature variables

姑父竟然拿五粮液款待自己,小虫心中有说不出的豪迈。小虫长这么大,从没喝过五粮液。今天喝了,真他妈的爽!姑父太看得起自己了,小虫打心眼里感激姑父。姑父帮自己找了份好工作,市场管理员多拽呀,小商小贩见了就点头哈腰。玉敏能嫁给自己,也是看中了这份工作,以及姑父这层关系。

3.2 恶劣天气与馈线故障的相关性分析

绘制在不同的温度特征变量和120馈线2014年1月至2015年6月时间段中馈线月故障数变量之间的散点关系图,如图4所示。

从图4中可发现只有当各类温度特征变量的值较高的情况下,才出现有馈线处于较高的月故障次数。如图4(a)中当月平均温度大于24°C时,部分馈线才开始出现月故障数大于10次/月的情况。证明温度的升高对馈线的故障有一定的影响,因此将此六类温度特征变量作为故障特征变量。

(a) (b) (c)

5 三类恶劣天气下馈线故障情况分析 Fig.5 Analysis of feeder outage in three kinds of bad weather

由图5发现随着月降水量上升、月雷暴日和大风日数增多,馈线月平均故障数也逐渐增大,呈正相关关系。因此,将此“月降水量分级”、“月雷暴日数分级”、“月大风日数分级”作为故障特征变量。

4 馈线故障的自相关特性

时间特性分析目的一方面在于探索馈线故障的发生在不同月份是否存在差异性,另一方面,在于分析馈线故障的历史相关性(即馈线故障和之前月份发生故障的关联性)。

4.1 馈线故障与设备投运时间的关系

已有的研究表明设备设备故障率与投运时间的关系呈现浴盆曲线。设备在投运初期Ⅰ阶段故障率较高,然后逐渐下降到了Ⅱ阶段其故障率较为平稳,最后随着投运时间的增长进入Ⅲ阶段故障率开始快速上升。依据馈线上各类设备的平均投运时间,以月为单位绘制馈线上各类设备和馈线月故障次数的散点关系图如图6。

6 馈线故障与设备投运时间的关系分析 Fig.6 Analysis of relationship between feeder outage and equipment operation time

由图6可知,各类设备的平均投运时间与馈线月故障数的关系基本符合设备故障率的“浴盆曲线”规律。在设备的投运初期即Ⅰ阶段,馈线月故障发生次数较大的情况发生较多;随后进入Ⅱ阶段后馈线月故障发生次数随着设备投运时间逐渐增大后保持平稳。本文所采集数据中未呈现Ⅲ阶段的故障规律,可能是因为在设备还未进入第Ⅲ阶段时电力公司已更换设备。鉴于馈线故障与设备投运时间存在的非线性关系,将各类设备的投运时间作为故障特征变量。

4.2 馈线故障与设备数量的关系

基于设备数量越多馈线累加的故障率越高的假设,本文进行实际的数据分析。绘制120条馈线2014年1月至2015年6月的月故障数与设备数量的散点关系图如图7。

分别计算图7中馈线月故障数与馈线分支线路数、变压器数、分段绝缘导线数、熔断器数的相关系数|r|为0.52、0.63、0.63、0.62,都为显著线性相关。而馈线月故障数与负荷开关、分段电缆数量的相关系数|r|分别为0.26、-0.12,为弱线性相关。因此仅将馈线分支线路数、变压器数、分段绝缘导线数、熔断器数初步选定作为故障特征变量,而弱线性相关的故障特征变量进行剔除。

7 馈线故障与设备数量的关系分析 Fig.7 Analysis of relationship between feeder outage and equipment number

4.3 馈线故障与绝缘导线/电缆长度的关系

本小节分析“馈线绝缘导线长度”和“馈线电缆长度”特征变量与馈线月故障发生次数的关系。绘制120条馈线在2014年1月至2015年6月的故障发生次数与这两个特征变量的三维散点关系图如图8所示。

8 馈线故障与绝缘导线/电缆长度的关系分析 Fig.8 Analysis of relationship between feeder outage and insulated wire/cable length

从图8中可直观看出随着电缆长度和绝缘导线长度增加,对应馈线的月故障发生次数有上升趋势。然后,分别计算图8中馈线月故障数和馈线绝缘导线长度、电缆长度的相关系数分别为0.62、0.59,证明是显著线性相关。因此选取“馈线绝缘导线长度”和“馈线电缆长度”为故障特征变量。

5 馈线运况对馈线故障的影响

馈线故障的运行影响因素主要是提取了“馈线月平均负荷”和“馈线月最大负荷”为特征变量。绘制120条馈线2014年1月至2015年6月的两个特征变量与月故障数的三维散点关系图进行分析。

从图9可发现随着馈线月平均负荷和馈线月最大负荷增大,对应的大部分馈线月故障发生次数在上升,且在月最大负荷较大时发生的才存在的馈线月故障发生次数较大的情况;进一步计算馈线月故障数和月平均负荷、月最大负荷的相关系数|r|分别为0.47、0.58,证明是显著线性相关。因此选取“馈线月平均负荷”和“馈线月最大负荷”为故障特征变量。

实践活动系列的校园文化艺术节主要通过艺术活动,挖掘学科和活动的美育功能,展示学生个人才艺。其中,表演类包括合唱比赛、校园歌手比赛、音乐会、各类汇报演出等。展览类包括绘画现场比赛、作业展、学生自选作品展、风景写生展、书法展、摄影作品比赛及展览、动漫设计和工艺作品比赛及展览、瓷版画设计比赛及展览,还有各类教育活动宣传画的创作比赛及展览等。

9 馈线故障与运行影响因素的关系分析 Fig.9 Analysis of relationship between feeder outage and operational influential factors

6 结语

本文通过数据探索分析对数据预处理所得的故障特征变量进行初步筛选,通过统计、制图、相关性分析等方法直观有效地剔除无关故障特征变量。提出了四个维度的故障特征变量:馈线故障时间-地域特性(故障时间、n-1、n-2、n-3月故障数、馈线所属变电站);外部环境影响因素(月平均气温、月平均高/低温、极端高/低温数据、月雷暴日分级、月大风日分级);自身影响因素(熔断器平均投运时间、分段电缆平均投运时间、负荷开关平均投运时间、变压器数、熔断器数、分段绝缘导线长度);运行影响因素(馈线月平均负荷、馈线月最大负荷。结果为构建馈线故障预测模型提供了基础。

比如在给大班幼儿教绕口令时,一开始幼儿并不知道什么是绕口令,而根据幼儿的年龄特点和发展实际,仅仅使用语言描述和讲解定义等方式显然与教育教学规律相违背。所以,在绕口令课程中,教师可以借助现代教学媒体,向孩子们展示相关的相声节目,先让孩子们有了看相声、学相声的兴趣,再逐步引入绕口令,鼓励孩子们模仿相声,学习绕口令。幼儿在观看、模仿和练习中就可以体会绕口令的内涵,激发了语言学习兴趣。等幼儿把绕口令练习到一定程度后,教师再利用教学媒体录音的方式进一步提高幼儿学习语言的积极性,把幼儿自己说的绕口令录下来,再放给他们听,进一步掀起幼儿学说绕口令,积极参与语言互动的高潮,让幼儿能够最大程度地释放语言潜能。

参考文献:

[1] BIE Z, ZHANG P, LI G, et al.Reliability evaluation of active distribution systems including microgrids[J].IEEE Transactions on Power Systems, 2012, 27(04):2342-2350.

[2] XU X, MITRA J, WANG T, et al.Evaluation of operational reliability of a microgrid using a short-term outage model[J].IEEE Transactions on Power Systems, 2014, 29(05):2238-2247.

[3] 赵洪山, 王莹莹, 陈松.需求响应对配电网供电可靠性的影响[J].电力系统自动化, 2015,39(17):49-55.

ZHAO Hongshan,WANG Yingying,CHEN Song.Impact of demand response on distribution system reliability[J].Automation of Electric Power Systems, 2015,39(17):49-55.

[4] CONTI S, NICOLOSI R, RIZZO S A.Generalized systematic approach to assess distribution system reliability with renewable distributed generators and microgrids[J].IEEE Transactions on Power Delivery, 2011, 27(01):261-270.

[5] 赵腾, 张焰, 张东霞.智能配电网大数据应用技术与前景分 析[J].电网技术,2014, 38(12):3305-3312.

ZHAO Teng, ZHANG Yan, ZHANG Dongxia.application technology of big data in smart distribution grid and its prospect analysis[J].Power System Technology, 2014, 38(12): 3305-3312.

[6] 程鹏飞,何江,马岩.10 kV城市配电网可靠性基础参数预测方法分析[J].广东电力,2014,7(08):94-97+101.

CHENG Pengfei, HE Jiang, MA Yan.Prediction method for reliability underlying parameters of 10 kV city distribution network[J].Guangdong Electric Power, 2014,7(08):94-97+101.

[7] 刘亚南, 卫志农, 钟淋涓,等.基于PCA和RVM的电网供电可靠性预测模型研究[J].电力系统保护与控制, 2012, 40(20):101-105.

LIU Yanan, WEI Zhinong, ZHONG Linjuan1, et al.Study on the forecasting model of power supply reliability based on PCA and RVM[J].Power System Protection & Control, 2012,40(20):101-105.

[8] 宋云亭, 吴俊玲, 彭冬,等.基于BP神经网络的城网供电可靠性预测方法[J].电网技术, 2008,32(20):56-59.

SONG Yunting,WU Junling,PENG Dong, et al.A BP neural network based method to predict power supply reliability of urban power network[J].Power System Technology, 2008, 32(20):56-59.

[9] 袁捷.贵州电网大数据应用探讨[J].电力大数据, 2017,20(12):4-7.

YUAN jie.Discussion on application of big data in Guizhou power grid[J].Power Systems And big Data, 2017, 20(12):4-7.

[10] 彭晓平, 段琳, 程旭明,等.基于电力大数据的实时流数据处理技术研究[J].电力大数据, 2017, 20(08):58-60.

PENG Xiaoping, DUAN Lin, CHENG Xuming.Research on real time flow data processing technology based on large power data[J].Power Systems And big Data, 2017, 20(08):58-60.

[11] 王守相, 梁栋, 葛磊蛟.智能配电网态势感知和态势利导关键技术[J].电力系统自动化,2016,40(12):2-8.

WANG Shuoxiang, LIANG Dong, GE Leijiao.Key technologies of situation awareness and orientation for smart distribution systems[J].Automation of Electric Power Systems, 2016, 40(12): 2-8.

[12] 刘巍,黄曌,李鹏,等.面向智能配电网的大数据统一支撑平台体系与构架[J].电工技术学报,2014,29(S1):486-491.

LIU Wei,HUANG Zhao, LI Peng, et al.Summary about system and framework of unified supporting platform of big data for smart distribution grid[J].Transactions of China Electrotechnical Society, 2014, 29(S1): 486-491.

[13] 刘科研,盛万兴,张东霞,等.智能配电网大数据应用需求和场景分析研究[J].中国电机工程学报,2015,35(02):287-293.

LIU Keyan, SHENG Wanxing, ZHANG Dongxia, et al.Big data application requirements and scenario analysis in smart distribution network[J].Proceedings of the CSEE,2015, 35(02): 287-293.

[14] 苗新,张东霞,孙德栋.在配电网中应用大数据的机遇与挑战[J].电网技术,2015,39(11):3122-3127.

MIAO Xin, ZHANG Dongxia, SUN Dedong.The opportunity and challenge of big data's application in power distribution networks[J].Power System Technology, 2015, 39(11): 3122-3127.

[15] HUGHES G.On the mean accuracy of statistical pattern recognizers[J].IEEE Transactions on Information Theory, 1968, 14(01):55-63.

社会科学研究通常被划分为描述性、解释性和探索性三大研究领域,不同的研究领域都有自身适用与匹配的研究方法。其中,质性研究方法与定量研究方法是社会科学研究方法中两大重要的体系(陈向明,2000)。但是,在旅游者行为的研究中,由于旅游现象的复杂性、综合性与交叉性,研究方法选择往往具有多样性与复合性的特征。

采用SPSS20.0统计软件进行理干预前、护理干预后一周、护理干预后两周、出院前一周的焦虑分数的统计与分析,两组间比较采用t检验,两组患者不同护理干预后的计量资料以均数(±s)表示,当两组患者的各指标存在显著差异时,以P<0.05为差异有统计学意义。

杨凤生,熊波,蔡广林,杨琦岑
《电力大数据》 2018年第03期
《电力大数据》2018年第03期文献

服务严谨可靠 7×14小时在线支持 支持宝特邀商家 不满意退款

本站非杂志社官网,上千家国家级期刊、省级期刊、北大核心、南大核心、专业的职称论文发表网站。
职称论文发表、杂志论文发表、期刊征稿、期刊投稿,论文发表指导正规机构。是您首选最可靠,最快速的期刊论文发表网站。
免责声明:本网站部分资源、信息来源于网络,完全免费共享,仅供学习和研究使用,版权和著作权归原作者所有
如有不愿意被转载的情况,请通知我们删除已转载的信息