《第6章-电力窃漏电用户自动识别ppt课件.ppt》由会员分享,可在线阅读,更多相关《第6章-电力窃漏电用户自动识别ppt课件.ppt(89页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、R语言数据分析与挖掘实战配套PPT 更多下载:http:/www.tipdm.org/ts/654.jhtml 电力窃漏电用户自动识别张良均2023/6/5 2内部资料 泰迪科技()u 据统计,全国每年因窃电造成的损失都在200亿元左右;被查获的窃电案件不足总窃电案件的30%l 如深圳龙岗工业区一家只有两条生产 线的小塑料包装厂,一年窃电折价就 3040万元之多l 某市06年因窃电损失达4亿元l 某市2014年以来,共查处窃电案件 114起、追补电费和违约金451.8万 元,依法追究刑事责任7人。u 这不仅给国有资产造成巨大的损失,也严重扰乱了供电秩序,威胁到电网安全运行。案例背景 3内部资料
2、 泰迪科技()案例背景 4内部资料 泰迪科技()游戏开始啦 5内部资料 泰迪科技()u 窃电就是利用各种手段使电能计量装置电量少计或不计,最常见的是从电能计量的基本原理入手。我们知道,一个电能表计量电量的多少,主要决定于电压、电流、功率因数三要素和时间的乘积,因此,只要想办法改变三要素中的任何一个要素都可以使电表慢走、停走甚至反走,从而达到窃电的目的。u 窃电分类:硬件窃电软件窃电强磁强电干扰等方式 案例背景 6内部资料 泰迪科技()案例背景u常见硬件窃电种类:失压、断相法 失流法 移相法 电流反极性 分流法u窃电方式:电能表(接线盒)铅封,直接或加装遥控装置改变误差 电表(接线盒)端盖铅封,
3、改变接线方式 7内部资料 泰迪科技()u常见软件窃电种类:修改电表时钟,使分时计量的尖、峰、平、谷错位。扩差,通过调表软件修调电表精度。u窃电方式:开电能表设置铅封,用软件改变参数或精度案例背景 8内部资料 泰迪科技()u强磁强电干扰 静电攻击电能表,物理损坏或数据改变 磁场攻击电能表,误差改变或数据改变 高频电磁场攻击电能表,误差改变或数据改变 直流用电模式,少计电量 冲击负荷,需量考核不到 跨相用电的问题案例背景 9内部资料 泰迪科技()u在南网发现的几种窃电种类与预防 加装分流电阻 加装分流遥控器 表内短接案例背景 10内部资料 泰迪科技()l 案例一:中山供电局(加装分流电阻)案例背景
4、 11内部资料 泰迪科技()l 案例二:东莞供电局(加装分流电阻)案例背景 12内部资料 泰迪科技()l 电流采样电路原理图案例背景 13内部资料 泰迪科技()l 添加分流电阻后原理图案例背景 14内部资料 泰迪科技()l 案例三:东莞供电局(加装遥控装置)案例背景 15内部资料 泰迪科技()l 加装遥控分流器案例背景 16内部资料 泰迪科技()l 案例四:东莞供电局(接线盒内加装遥控分流 器)案例背景 17内部资料 泰迪科技()l 案例五:清远供电局(电流CT内部被短接)案例背景 18内部资料 泰迪科技()u软件窃电1.更改电表的相关参数2.此类偷电事件通常为熟悉电表相关知识的人员或业内人士
5、参与,对有分时计量的电表采用更改电表的时钟或电表时段来避开时段的计量。更有甚者用更改电表底度的方法来达到偷电的目的。但此类事件多功能电表均有相关的事件记录,修改时间、时段、清零时间(年月日时分)、清零前总及费率的正向有功电量、正向无功电量、反向有功电量、反相无功等电量均有事件记录。并且清零时的事件记录功能是不能被清除的,同时电表加装有开盖检测功能。强大的事件记录功能就像飞机的黑匣子一样记录了电表的多种事件,方便进行相关查询。案例背景 19内部资料 泰迪科技()背景知识u 电能通过各级变压器、输电线路输送到各个用电用户。u 一条输入线路上有几个用户u 总线路及线路上每个用户均有电能表记录用电信息
6、u 计量终端每15分钟自动采集各电能表的信息并上报监控中心u 计量终端能实现告警功能并上报l 电流异常、电压异常l 但常有误报、漏报现象 20内部资料 泰迪科技()背景知识 线损:在输送和分配电能过程中,电力网中各个元件所产生的功率损失和电能损失以及其他损失。它是用供电量与售电量相减计算出来的。线损率:线损电量占供电量的百分比称为线损率,它是用来考核电力系统经济性运行的重要指标。正常情况,一条线路的日线损率的范围一般在3%15%。线损率公式:21内部资料 泰迪科技()背景知识u 电力用户分为哪些类型?居民用电:用电不具有营利性质,完全为了居民的生活需求。非居民照明用电范围:机关、部队、医院、幼
7、儿园、福利院、养老院、学校、路灯等用电。商业用电范围:从事商品交换,提供有偿服务等的电力用户的用电一般工业用电范围:中小工业:以电为原动力或以电冶炼、烘焙、熔燃、电解、电化的非工业性生产、试验用电,其总容量在3千瓦及以上的用电(含基建用电).22内部资料 泰迪科技()背景知识u 电力用户分为哪些类型大工业用电:以电为原动力,电冶炼、烘焙、熔焊、电解、电化的一切工业生产,受电变压器总容量在315千伏安以上者,以及对外承担生产及修理业务的符合上述容量规定的用电农业生产范围农业排灌范围 23内部资料 泰迪科技()思考u 谁有窃电的动机(什么样的用户最有可能窃电)?u 窃漏电的重灾区在哪种用户类型中?
8、u 窃电的用户有哪些特征?(可以从哪些指标来区分窃电和非窃电用户?)u 不同类型的用电的特征是否相同?u 如何进行防窃电检查?u 检查窃漏电也是有成本的,如何使得工作的效费比高?u 使用数据挖掘来进行窃漏电用户识别,该建立何种模型?24内部资料 泰迪科技()u 传统的用电检查及反偷查漏工作主要依靠突击检查,存在先天性的缺陷和不足:用电检查工作是按计划开展的,有一定的周期性。在两次检查之间客户存在的安全用电隐患、计量装置故障及窃电行为等不容易发现。没有针对性,在进行用电检查时,按既定计划先后到现场进行,面对几万专变用户不能及时发现计量故障及窃电行为。用电检查人员在开展工作时,缺乏客户负荷情况和用
9、电情况的信息。现场检查掌握的也只是客户当时的情况。如果客户存在不定期的窃电行为,将难以发现。窃漏电检测(传统方法)25内部资料 泰迪科技()u 硬件改造:通过电能表硬件方面的改造,加强电表的铅封管理,增加对电能表动手脚窃电的难度u 电能表的改造面临以下问题与挑战:耗资大周期长更改范围太大只能限制针对电能表改造的窃电行为,对表前窃电无能为力窃电手段日新月异,无法一劳永逸窃漏电检测(传统方法)26内部资料 泰迪科技()u 软件方面:基于指标加权的用电异常分析模型,根据报警事件发生前后计量点有关的电流、电压、负荷数据,构建基于指标加权的用户异常分析模型u 虽然能获得用电异常的某些信息,但存在以下缺陷
10、:终端误报或漏报过多,无法快速精确定位窃漏电嫌疑用户的目的 模型各输入指标权重需要用专家的知识和经验,具有很大的主观性,存在明显的缺陷,所以实施效果往往不尽如人意。窃漏电检测(传统方法)27内部资料 泰迪科技()系统资料背景u 计量自动化系统数据数据项 数据内容 数据粒度瞬时量A/B/C 相电压/电流、功率、负荷、功率因数等15分钟告警信息 表计、终端等设备异常告警信息 实时线损统计信息 日线损统计信息 日电量 用户表计与终端的日冻结电量信息 日表码 用户表计与终端的表码信息 15分钟 28内部资料 泰迪科技()系统资料背景数据项 数据内容 数据粒度档案表电价表信息 最新客户计费点信息 最新行
11、业类别信息 最新表计档案信息 最新10KV 馈线线路信息最新变电站信息 最新终端档案信息 最新电源点档案表信息 最新单位组织机构信息 最新电表与终端关系表信息 最新运行表计表信息 最新运行变压器表信息 最新工单表历史窃电工单信息 随时追加线损异常工单信息 随时追加换表工单信息 随时追加电量退补工单信息 随时追加计量故障工单信息 随时追加改类工单信息 随时追加增容工单信息 随时追加线损统计信息 月线损统计信息(线路、片区、台区)月线变户档案 线变户档案及拓扑关系(专变、公变)最新电量电费 用户表计月冻结电量电费信息表 月冻结表码 用户表计月冻结表码信息表 月u 营销系统数据 29内部资料 泰迪科
12、技()思考u 有没有一种防窃漏电方法:l 耗资少l 实时监测l 准确定位 30内部资料 泰迪科技()挖掘目标1.归纳出窃漏电用户的关键特征,构建窃漏电用户的识别模型;2.利用实时监测数据,调用窃漏电用户识别模型实现实时诊断。31内部资料 泰迪科技()上机实验 32 分析方法与过程4背景与挖掘目标 1拓展思考目录 32内部资料 泰迪科技()分析方法与过程 33内部资料 泰迪科技()思考u 窃漏电用户自动识别模型属于哪类模型?u 现有哪些数据?u 需要什么样的数据?u 需要多长时间的数据?34内部资料 泰迪科技()思考计量电量 硬件窃电 软件窃电 强磁强电干扰 各种窃电方法 线损率 35内部资料
13、泰迪科技()数据抽取 36内部资料 泰迪科技()数据抽取u 计量自动化系统数据数据项 数据内容 来源系统收集/更新频度瞬时量A/B/C 相电压/电流、功率、负荷、功率因数等计量自动化系统 小时告警信息 经过辨别后的设备异常告警信息 计量自动化系统 日 37内部资料 泰迪科技()数据项 数据内容 来源系统收集/更新频度档案表电价表信息 营销管理系统 日客户计费点信息 营销管理系统 日行业类别信息 营销管理系统 日表计档案信息 营销管理系统 日10KV 馈线线路信息营销管理系统 日终端档案信息 营销管理系统 日电源点档案表信息 营销管理系统 日电表与终端关系表信息 营销管理系统 日工单表历史窃电工
14、单信息 营销管理系统 日线损异常工单信息 营销管理系统 日换表工单信息 营销管理系统 日电量退补工单信息 营销管理系统 日计量故障工单信息 营销管理系统 日改类工单信息 营销管理系统 日增容工单信息 营销管理系统 日线变户档案 线变户档案及拓扑关系(专变、公变)营销管理系统 月u 营销系统数据数据抽取 38内部资料 泰迪科技()分析方法与过程u 与窃漏电相关的原始数据主要有用电负荷数据、终端报警数据、违约窃电处罚信息以及用户档案资料等。u 从营销系统抽取的数据主要有:用户基本信息:用户名称、用户编号、用电地址、用电类别、报装容量、计量方式、电流互感器变比、电压互感器变比;违约、窃电处理记录;计
15、量方法及依据。u 从计量自动化系统采集的数据属性主要有:实时负荷:时间点、计量点、总有功功率、A/B/C相有功功率、A/B/C相电流、A/B/C相电压、A/B/C相功率因数;终端报警。第1步:数据抽取 39内部资料 泰迪科技()原始数据情况时间有功总0:000:150:300:451:001:151:301:452:002:152:302:453:00050100150200250u 用电负荷数据,采集时间间隔为15分钟,可进一步计算该用户的用电量。40内部资料 泰迪科技()原始数据情况u 终端报警数据,其中与窃漏电相关的报警能较好的识别用户的窃漏电行为用户名称 时间 计量点ID 报警编号 报
16、警名称某企业大用户 2010/4/1 0:01 0319001000045110001 135 最大需量复零某企业大用户 2010/4/2 18:44 0319001000045110001 152 电流不平衡某企业大用户 2010/4/2 18:47 0319001000045110001 143 A 相电流过负荷某企业大用户 2010/4/2 18:47 0319001000045110001 145 C 相电流过负荷某企业大用户 2010/4/2 21:07 0319001000045110001 152 电流不平衡某企业大用户 2010/4/2 21:22 03190010000451
17、10001 145 C 相电流过负荷某企业大用户 2010/4/2 21:25 0319001000045110001 143 A 相电流过负荷某企业大用户 2010/4/3 5:45 0319001000045110001 145 C 相电流过负荷 41内部资料 泰迪科技()原始数据情况u 用户违约、窃电处理通知书,里面记录了用户的用电类别和窃电时间*42内部资料 泰迪科技()原始数据情况u 用户违约、窃电处理通知书,里面记录了用户的用电类别和窃电时间 43内部资料 泰迪科技()分析方法与过程u 为了尽可能全面覆盖各种窃漏电方式,建模样本要包含不同用电类别的所有窃漏电用户及部分正常用户。u
18、窃漏电开始时间和结束时间是表征窃漏电用户窃漏电的关键时间节点 在这些时间节点上,用电负荷和终端报警等数据会有一定的特征变化,样本数据抽取时务必要包含关键时间节点前后一定范围的数据u 本案例抽取某市近5年来所有的窃漏电用户有关数据和不同用电类别正常用电用户共208个用户的有关数据,时间为2009年1月1日至2014年12月31日,同时包含每天是否窃漏电的标识。第1步:数据抽取 44内部资料 泰迪科技()分析方法与过程u 窃漏电用户在电力计量自动化系统的监控大用户中只占小部分u 某些大用户不可能存在窃漏电行为,如银行、税务、学校、工商等非居民类别,故在数据预处理时有必要将这些类别用户剔除。u 用电
19、负荷不能直接体现出用户的窃漏电行为,终端报警存在很多误报和漏报情况,故需要进行数据探索和预处理,总结窃漏电用户的行为规律,再从数据中提炼出描述窃漏电用户的特征指标。u 结合历史窃漏电用户信息,整理出识别模型的专家样本数据集,再进一步构建分类模型,实现窃漏电用户的自动识别。初步分析:45内部资料 泰迪科技()分析方法与过程第2步:探索分析窃漏电用户在各种用电性质中的分布 46内部资料 泰迪科技()分析方法与过程第2步:探索分析不同类用户用电量随时间的变化情况随机抽取一个正常用电用户和一个窃漏电用户有什么特点?47内部资料 泰迪科技()日期 日电量(kW)日期 日电量(kW)2014/9/1 58
20、40 2014/9/16 50722014/9/2 5704 2014/9/17 54802014/9/3 5754 2014/9/18 58322014/9/4 5431 2014/9/19 48162014/9/5 5322 2014/9/20 27482014/9/6 2392 2014/9/21 25362014/9/7 3225 2014/9/22 53842014/9/8 5296 2014/9/23 52882014/9/9 5488 2014/9/24 59282014/9/10 5713 2014/9/25 58962014/9/11 5542 2014/9/26 59522
21、014/9/12 5928 2014/9/27 27922014/9/13 2848 2014/9/28 26002014/9/14 3048 2014/9/29 50002014/9/15 5216 2014/9/30 4704 48内部资料 泰迪科技()分析方法与过程第2步:探索分析不同类用户用电量随时间的变化情况u 问题:如何从定量描述电量的不同变化趋势?有什么特点?有下降趋势的都有窃漏电嫌疑吗?49内部资料 泰迪科技()日期 日电量(kW)日期 日电量(kW)2014/9/1 4640 2014/9/16 32602014/9/2 4450 2014/9/17 35902014/9/3
22、 4300 2014/9/18 30402014/9/4 4290 2014/9/19 30302014/9/5 4010 2014/9/20 34102014/9/6 2560 2014/9/21 24902014/9/7 2720 2014/9/22 21602014/9/8 3740 2014/9/23 28502014/9/9 3850 2014/9/24 29002014/9/10 4150 2014/9/25 30902014/9/11 4210 2014/9/26 28402014/9/12 4680 2014/9/27 15302014/9/13 2760 2014/9/28
23、20202014/9/14 2680 2014/9/29 25402014/9/15 3630 2014/9/30 2440 50内部资料 泰迪科技()分析方法与过程1.数据清洗:从业务以及建模的相关需要方面考虑,筛选出需要的数据a)通过对数据的初步探索,发现在用电类别中,非居民用电类别不存在漏电窃电的现象,将该类别的用电数据过滤掉。b)结合本案例的业务,节假日用电量与工作日相比,明显偏低。为了避免节假日用电低谷数据可能造成的干扰,过滤节假日的用电数据。第3步:数据预处理 51内部资料 泰迪科技()分析方法与过程n 第3步:数据预处理2.异常值处理:在原始数据样本中存在异常值的情况,以及一些超
24、出指标阈值范围的数据,若不处理会严重影响供出电量的计算结果,导致后期数据建模效果不佳,对这类异常数据,当成缺失值进行插补处理。52内部资料 泰迪科技()分析方法与过程3.缺失值处理:第3步:数据预处理日期用户A 用户B 用户C2014/9/1 235.8333 324.0343 478.32312014/9/2 236.2708 325.6379 515.45642014/9/3 238.0521 328.0897 517.09092014/9/4 235.9063 514.892014/9/5 236.7604 268.8324 2014/9/8 404.048 486.09122014/9
25、/9 237.4167 391.2652 516.2332014/9/10 238.6563 380.8241 2014/9/11 237.6042 388.023 435.35082014/9/12 238.0313 206.4349 487.6752014/9/15 235.0729 2014/9/16 235.5313 400.0787 660.23472014/9/17 411.2069 621.23462014/9/18 234.4688 395.2343 611.34082014/9/19 235.5 344.8221 643.08632014/9/22 235.6354 385.
26、6432 642.34822014/9/23 234.5521 401.6234 2014/9/24 236 409.6489 602.93472014/9/25 235.2396 416.8795 589.34572014/9/26 235.4896 556.3452 53内部资料 泰迪科技()分析方法与过程3.缺失值处理:在原始计量数据,特别是用户电量抽取过程中,发现存在缺失的现象。若将这些值抛弃掉,会严重影响后续分析结果。具体会产生什么不良结果?第3步:数据预处理 54内部资料 泰迪科技()分析方法与过程3.缺失值处理a)拉格朗日插值法其中 x 为缺失值对应的下标序号,Ln(x)为缺失值
27、的插值结果,xi 为非缺失值 yi 的下标序号。首先从原始数据集中确定因变量和自变量,取出缺失值前后5 个数据(前后数据不足5 个的,将仅有的数据组成一组),根据取出来的10 个数据组成一组构造插值公式。第3步:数据预处理 55内部资料 泰迪科技()分析方法与过程3.缺失值处理第3步:数据预处理 56内部资料 泰迪科技()分析方法与过程4.数据变换a)电量趋势下降指标b)线损指标c)告警类指标第3步:数据预处理 57内部资料 泰迪科技()分析方法与过程4.数据变换a)电量趋势下降指标 从正常用电到窃漏电特征分析正常用户的用电量较为平稳,窃漏电用户的用电量呈现下降的趋势,然后趋于平缓第3步:数据
28、预处理用电量趋势正常用电正常用电第1天窃漏电第2天窃漏电第3天窃漏电 58内部资料 泰迪科技()分析方法与过程4.数据变换a)电量趋势下降指标 对统计当天设定前后5天为统计窗口期,计算这11天内的电量趋势下降情况,首先计算这11天的每天的电量趋势,计算第i天的用电量趋势是考虑前后5天期间的用电量斜率,即:其中,ki为第i天的电量趋势,fl 为第 l天的用电量。59内部资料 泰迪科技()分析方法与过程4.数据变换a)电量趋势下降指标若电量趋势为不断下降的,则认为具有一定的窃电嫌疑,故计算这11天内,当天比前一天用电量趋势为递减的天数,即设有则这11天内的电量趋势下降指标为用电趋势不断下降就一定属
29、于窃电吗?有没有更进一步的特征?第3步:数据预处理 60内部资料 泰迪科技()分析方法与过程4.数据变换a)电量趋势增长指标b)线损指标线损率是用于衡量供电线路的损失比例,可结合线户拓扑关系计算出用户所属线路在当天的线损率第3步:数据预处理线损率公式:其中sl 为第 l 天的线路供电量,为线路上各个用户的总用电量 61内部资料 泰迪科技()分析方法与过程4.数据变换a)电量趋势增长指标b)线损指标若用户发生窃漏电,则当天的线损率会上升由于用户每天的用电量存在波动,线损率也有正常的变动范围,单纯以当天线损率上升作为窃漏电特征则误差过大考虑前后几天的线损率平均值(去噪),判断其增长率是否大于1%(
30、阈值),若线损率的增长率大于1%则具有窃漏电的可能性。如何设定阈值?62内部资料 泰迪科技()分析方法与过程4.数据变换a)电量趋势增长指标b)线损指标对统计当天设定前后5天为统计窗口期分别计算统计当天与前5天之间的线损率平均值 Vi1 和统计当天与后5天之间的线损率平均值 Vi2,若 Vi1 比 Vi2 的增长率大于1%,则认为具有一定的窃电嫌疑,可定义线损指标 63内部资料 泰迪科技()分析方法与过程4.数据变换a)电量趋势增长指标b)线损指标c)告警类指标 窃漏电相关的终端报警主要有电压缺相、电压断相、电流反极性等告警,计算发生与窃漏电相关的终端报警的次数总和,作为告警类指标。第3步:数
31、据预处理 64内部资料 泰迪科技()分析方法与过程 对2009年1月1日至2014年12月31日所有窃漏电用户及部分正常用户的电量、告警及线损数据和该用户在当天是否窃漏电的标识,按窃漏电评价指标进行处理,得到专家样本库。第5步:构建专家样本 65内部资料 泰迪科技()分析方法与过程第6步:构建模型1.构建窃漏电用户识别模型 对专家样本随机选取20%的作为测试样本,剩下80%的作为训练样本。a)神经网络建模b)CART决策树建模 66内部资料 泰迪科技()分析方法与过程第6步:构建模型1.构建窃漏电用户识别模型a)神经网络由混淆矩阵(训练样本),分类准确率为94.17%,正常用户被误判为窃漏电用
32、户占正常用户的1.95%,窃漏电用户被误判为正常用户占正常窃漏电用户的28.6%。67内部资料 泰迪科技()分析方法与过程b)CART决策树由混淆矩阵(训练样本),分类准确率为91.67%,正常用户被误判为窃漏电用户占正常用户的5.85%,窃漏电用户被误判为正常用户占正常窃漏电用户的22.86%。68内部资料 泰迪科技()第68 页二分类问题的判断情况n 正确的肯定(true positive,TP)n 正确的否定(true negative,TN)n 错误的肯定(false positive,FP):取伪错误n 错误的否定(false negative,FN):拒真错误预测的类+-实际的类+
33、TP FN-FP TN 69内部资料 泰迪科技()第69 页二分类问题的判断情况u 真正率TPR(true positive rate)被模型正确预测的正样本的比例 TPR=TP/(TP+FN)u 假正率FPR(false positive rate)被预测为正类的负样本比例 FPR=FP/(TN+FP)u 真负率TNR:TN/(TN+FP)u 假负率FNR:FN/(TP+FN)u 综合成功率是正确的分类数除以总体分类数:(TP+TN)/(TP+TN+FP+FN)预测的类+-实际的类+TP FN-FP TN 70内部资料 泰迪科技()ROC曲线u 接受者操作特征曲线(Receiver Oper
34、ating Characteristic Curve,ROC)u 显示分类器真正率和假正率之间折中的一种图形化方法。u 在ROC曲线中,真正率(TPR)沿y轴绘制,而假正率(FPR)显示在x轴上。沿着曲线的每个点对应于一个分类器归纳的模型。u ROC曲线上有几个关键点,它们都有公认的解释:(TPR=0,FPR=0):把每个实例都预测为负类的模型(TPR=1,FPR=1):把每个实例都预测为正类的模型(TPR=1,FPR=0):理想模型 71内部资料 泰迪科技()ROC 曲线u 两个不同分类器的ROC曲线u 好的分类模型应该尽可能靠近图的左上角,而一个随机猜测的模型应位于连接点(TPR=0,FP
35、R=0)和(TRP=1,FPR=1)的主对角线上 72内部资料 泰迪科技()分析方法与过程第6步:构建模型2.模型评价a)用测试样本对两个模型进行评价,评价方法采用ROC曲线进行评估。b)观测神经网络和CART决策树ROC曲线的CLASS2折线,经过对比发现神经网络的ROC曲线比CART决策树的ROC曲线更加靠近单位方形的左上角,神经网络ROC曲线下的面积更大,说明神经网络模型的分类性能较好,能应用于窃漏电用户识别。神经网络在测试样本下的ROC 曲线CART 决策树在测试样本下的ROC 曲线 73内部资料 泰迪科技()分析方法与过程第6步:构建模型3.进行窃漏电诊断 74内部资料 泰迪科技()
36、分析方法与过程第6步:构建模型3.进行窃漏电诊断 75内部资料 泰迪科技()分析方法与过程第6步:构建模型3.进行窃漏电诊断指标 值 备注参与验证的客户数 5000实际窃电用户数 9 已开罚单确认为窃电诊断为疑似窃电用户数 56 模型诊断结果其中实际窃电用户匹配数 5不匹配用户数 55 实际窃电判断为不窃电1 模型不支持,不窃电判断为窃电51 误报情况 因数据不完整无法判断3 历史线户关系不对应,负荷、线损不准误报率 1.1%(总用户数匹配用户的个数)/总用户数*100%漏报率 44.4%漏报用户/实际窃漏电用户*100%76内部资料 泰迪科技()分析方法与过程第6步:构建模型误报原因分析:1
37、、原始数据缺失或不完整,导致模型判断不准;2、用户是否窃电有待现场稽查论证。77内部资料 泰迪科技()分析方法与过程第6步:构建模型漏报原因分析:1、判断规则暂时无法表达(对应稽查处罚书中无法查明);2、用户窃漏电开始时间点不在模型诊断的周期范围内。78内部资料 泰迪科技()分析方法与过程详细显示嫌疑窃漏电用户信息 79内部资料 泰迪科技()分析方法与过程详细显示嫌疑窃漏电用户信息 80内部资料 泰迪科技()分析方法与过程采用GIS地图技术进行诊断结果展示,方便现场工作人员快速定位追踪,提高工作效率。81内部资料 泰迪科技()总结u 总体流程:82内部资料 泰迪科技()后续 本项目的成果已广泛
38、应用于广东电网各地市单位,大幅度提高了防窃漏电诊断的效率及准确性,有效发现并查处窃漏电事件70余起,追回电量损失(含违约相关费用)968万元,2013年至2014年已累计产生经济效益超6000万元。83内部资料 泰迪科技()后续模型构建完成后是否一直可用?84内部资料 泰迪科技()上机实验 34 拓展思考2背景与挖掘目标 1分析方法与过程目录 85内部资料 泰迪科技()拓展思考城市供水管网片区用水异常分析1 背景 目前用户用水异常现象出现频繁,如由工业用水,商业用水,家庭用户用水收取费用不同,引起的偷盗水行为;由管道漏损引起的用水量超标;由水表故障(或人为调整)引起的异常等等,如下图所示。这些
39、现象不仅损害了供水企业的经济利益,也引起了一定的水资源浪费。因此对用户用水行为分析,发现用水异常尤为重要,不仅可以发现偷盗水用户,以及时弥补供水商的经济利益,也可以及时发现管道漏损并及时修护,避免浪费和减少用户的经济损失。86内部资料 泰迪科技()拓展思考城市供水管网片区用水异常分析1 背景 收集某片区的数据(某一片区用户水表记录数据)如附件所示,数据记录每一个用户的水表号,每隔15分钟的水表行度数据,此数据可以得知每个用户这一段时间用水的详细记录。数据中终端地址(TERM_ADDR)可以理解为:某一栋楼,同一终端可以对应多个计量点(用户)。87内部资料 泰迪科技()拓展思考城市供水管网片区用
40、水异常分析列名 说明 示例OBJ_ID 计量点编号 1000003007TERM_ADDR 采集终端地址,对应楼栋 83010010DATA_DT 数据时间,采集间隔为15分钟 2014/6/2 17:15DATA_VALUE 数据值(单位:吨)298.7VALVE_STATUS阀门状态 00:阀门开启;01:阀门关闭;10:阀门未到位;11:阀门故障10BATTERY_VOLTAGE 电池电压 0:正常;1:欠压 0LOAD_DT 入库时间 2014/6/2 17:23附件一:某片区用户用水数据 88内部资料 泰迪科技()拓展思考城市供水管网片区用水异常分析2 问题1、根据用户用水数据,构建特征量刻画用户用水特征;2、基于1)构建模型识别异常用户(如渗漏、爆管等);3、根据用户用水特征,构建用户细分模型;4、建立预测模型,预测某一采集终端未来一周内的总用水量。