公共安全标准网
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111445017.4 (22)申请日 2021.11.30 (71)申请人 国网浙江省电力有限公司培训中心 地址 310015 浙江省杭州市拱 墅区舟山 东 路91号 (72)发明人 陈顺军 完泾平 王晓玲 赵能能  (74)专利代理 机构 杭州华鼎知识产权代理事务 所(普通合伙) 33217 代理人 胡根良 (51)Int.Cl. G06Q 10/04(2012.01) G06Q 50/06(2012.01) G06F 16/215(2019.01) G06F 16/22(2019.01) G06F 16/28(2019.01)G06K 9/62(2022.01) (54)发明名称 基于大数据分析的窃电嫌疑用户筛 选方法 (57)摘要 本发明公开了一种基于大数据分析的窃电 嫌疑用户筛选方法, 该方法包括: 通过Spark   Streaming从综合能源数据平台上 获取正常用户 在相同历史时间段内的关联表数据; 对在相同历 史时间段内的关联表数据进行数据预处理; 采用 DBSCAN聚类方法按照数量值分别对预处理后的 水表数据、 气表数据和热表数据进行聚类, 得到 水、 气和热表数据分别与电表数据之间的相关系 数; 获取待筛查用户当前月的真实关联表数据; 根据水表数据、 气表数据和热表数据分别与电表 数据之间的相关系数, 以及当前月的真实水表数 据、 真实气表数据和真实热表数据作为输入, 采 用预先训练好的LSTM用电预测模型确定用户当 前月的预测电表数据; 比较用户当前月的真实电 表数据和预测电表数据, 确定窃电嫌疑用户。 权利要求书1页 说明书4页 附图2页 CN 114399076 A 2022.04.26 CN 114399076 A 1.基于大 数据分析的窃电嫌疑用户筛 选方法, 其特 征在于, 包括: 步骤1: 通过Spark  Streamin g从综合能源数据平台上获取正常用户在相同历史时间段 内的关联表数据, 所述关联表数据包括: 水表数据、 气表数据、 热表数据和电表数据; 步骤2: 对在相同历史时间段内的所述关联表数据进行数据 预处理, 所述数据预处理包 括数据清洗和缺失值 填充; 步骤3: 采用DBSCAN聚类方法按照数量值分别 对预处理后的所述水表数据、 所述气表数 据和所述热表数据进行聚类, 得到所述水表数据、 所述气表数据和所述热表数据分别与所 述电表数据之间的相关系数; 步骤4: 通过Spark  Streamin g从综合能源数据平台上获取待筛查用户当前月的真实关 联表数据; 步骤5: 根据所述水表数据、 所述气表数据和所述热表数据分别与所述电表数据之间的 相关系数, 以及当前月的真实水表数据、 真实气表数据和真实热表数据作为输入, 采用预先 训练好的LSTM用电预测模型确定用户当前月的预测电表数据; 步骤6: 比较用户当前月的真实电表数据和预测电表数据, 确定窃电嫌疑用户。 2.根据权利要求1所述的基于大数据分析的窃电嫌疑用户筛选方法, 其特征在于, 步骤 6具体包括: 若待筛查用户的真实电表数据低于预测电表数据的8 0%, 则将该待筛查用户标 定为窃电嫌疑用户。 3.根据权利要求1所述的基于大数据分析的窃电嫌疑用户筛选方法, 其特征在于, 还包 括: 根据电表出现欠压、 逆相序、 反向或开盖告警的信号的次数, 对窃电嫌疑用户进行排 序。 4.根据权利要求1所述的基于大数据分析的窃电嫌疑用户筛选方法, 其特征在于, 还包 括: 根据用户当前月的预测电表数据和真实电表数据的比值大小, 对窃电嫌疑用户进行排 序。 5.根据权利要求3或4所述的基于大数据分析的窃电嫌疑用户筛选方法, 其特征在于, 还包括: 按照窃电嫌疑用户排序结果, 依次对窃电嫌 疑用户进 行现场排查, 若标定的窃电嫌 疑用户为真实窃电用户, 则按照窃电比例将该真实窃电用户的电表数据还原成实际电表数 据, 并重新对未排 查的窃电嫌疑用户进行排序。 6.根据权利要求5所述的基于大数据分析的窃电嫌疑用户筛选方法, 其特征在于, 还包 括: 将已经查获的真实窃电用户的关联表数据和用户信息增 加至案例库中进行存 储。权 利 要 求 书 1/1 页 2 CN 114399076 A 2基于大数据分析的窃电嫌疑用户筛选方 法 技术领域 [0001]本发明涉及电力资源管理技术领域, 尤其涉及一种基于大数据分析的窃电嫌疑用 户筛选方法。 背景技术 [0002]目前筛选窃电嫌疑用户的方法主要是将采集到的数据按单相用户是否欠压(阀值 一般取20%), 三相用户是否欠压、 电压逆相序、 电流反向、 开盖告警等信息来判断的。 但这 种方法筛查出来的窃电用户数量 非常少, 并且该方法的筛查结果中遗漏了通过欠流法窃电 的窃电用户; 此外, 由于各种干扰, 筛查结果中可能还包括有误筛查结果, 如此筛查出来的 真实窃电用户的数量更少。 同时, 确定的窃电用户信息未能有效反馈, 基于这种规则的筛选 方法本身不能自动提高筛 选精准度。 发明内容 [0003]针对传统窃电用户筛查方法会造成欠流法窃电用户的遗漏或者无法及时反馈窃 电用户信息以便自动提高筛选精准度的问题, 本发明提供一种基于大数据分析的窃电嫌疑 用户筛选方法, 能够筛选出欠流法窃电嫌疑用户, 能够根据窃电嫌疑程度对嫌疑用户精准 排序, 并且窃电规则能够根据现场窃电检查结果对初始的窃电嫌疑用户进 行重新核实和排 序, 实现了窃电用户信息的及时有效反馈, 能够自动不断提高筛 选精准度。 [0004]本发明提供的基于大 数据分析的窃电嫌疑用户筛 选方法, 包括: [0005]步骤1: 通过Spark  Streaming从综合能源数据平台上获取正常用户在相同历史时 间段内的关联表数据, 所述关联表数据包括: 水表数据、 气表数据、 热表数据和电表数据; [0006]步骤2: 对在相同历史时间段内的所述关联表数据进行数据预处理, 所述数据预处 理包括数据清洗和缺失值 填充; [0007]步骤3: 采用DBSCAN聚类方法按照数量值分别对预处理后的所述水表 数据、 所述气 表数据和所述热表数据进行聚类, 得到所述水表数据、 所述气表数据和所述热表数据分别 与所述电表数据之间的相关系数; [0008]步骤4: 通过Spark  Streaming从综合能源数据平台上获取待筛查用户当前月的真 实关联表数据; [0009]步骤5: 根据所述水表数据、 所述气表数据和所述热表数据分别与所述电表数据之 间的相关系数, 以及当前月的真实水表数据、 真实气表数据和真实热表数据作为输入, 采用 预先训练好的LSTM用电预测模型确定用户当前月的预测电表数据; [0010]步骤6: 比较用户当前月的真实电表数据和预测电表数据, 确定窃电嫌疑用户。 [0011]进一步地, 步骤6具体包括: 若待筛查用户的真实电表数据低于预测电表数据的 80%, 则将该待筛查用户标定为窃电嫌疑用户。 [0012]进一步地, 所述方法还包括: 根据电表出现欠压、 逆相序、 反向或开盖告警的信号 的次数, 对窃电嫌疑用户进行排序。说 明 书 1/4 页 3 CN 114399076 A 3

.PDF文档 专利 基于大数据分析的窃电嫌疑用户筛选方法

文档预览
中文文档 8 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共8页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于大数据分析的窃电嫌疑用户筛选方法 第 1 页 专利 基于大数据分析的窃电嫌疑用户筛选方法 第 2 页 专利 基于大数据分析的窃电嫌疑用户筛选方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 21:07:14上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。