公共安全标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210990877.4 (22)申请日 2022.08.18 (71)申请人 国家电网有限公司 地址 100000 北京市西城区长安 街86号 申请人 国网辽宁省电力有限公司抚顺供电 公司  东北大学 (72)发明人 张瑶瑶 李默涵 李智 靳双源  张海 刘正祎 李春煦 刘鑫蕊  汪广明 路天峰 王闯 肖隆君  张祥 王智宇  (74)专利代理 机构 北京东方芊悦知识产权代理 事务所(普通 合伙) 11591 专利代理师 彭秀丽(51)Int.Cl. G06F 16/36(2019.01) G06F 16/35(2019.01) G06F 16/33(2019.01) G06F 40/295(2020.01) G06F 40/30(2020.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 基于知识型信息抽取的配电网故障处理方 法及系统 (57)摘要 本发明公开了基于知识型信息抽取的配电 网故障处理方法及系统, 将含有非结构化的配电 网故障处理信息转化为文本数据, 并进行文本数 据中的实体抽取, 建立实体及实体间关系的配电 网故障处理知识图谱; 对故障后的配电网故障处 理信息进行文本实体抽取, 将抽取的文本实体数 据链接到所建立的配电网故障处理知识图谱对 应的实体数据; 若在配电网故障处理知识图谱中 查询到与故障后运行方式保持一致的配电网故 障类型, 则返回故障类型与相应的处置要点信 息; 否者, 人工辅助作出 故障处置。 系统通过构造 配电领域的知识图谱, 建立基于知识型信息的搜 索引擎, 智能地分析和挖掘大量的配电作业流程 及管理数据, 提高了配电网数据检索的准确性和 智能性。 权利要求书2页 说明书10页 附图2页 CN 115292518 A 2022.11.04 CN 115292518 A 1.一种基于知识型信息抽取的配电网故障处理方法, 其特征在于, 所述方法包括如下 步骤: 步骤1, 将含有非结构化的配电网故障处理预案文本转化为文本数据, 并进行文本数据 中的实体抽取, 建立实体及实体间关系的配电网故障处 理知识图谱; 步骤2, 根据采集到的配电网故障信息, 得到配电网故障后运行 方式报告; 步骤3, 对故障后运行方式报告进行预案文本分类、 命名实体识别和实体关系抽取, 将 抽取的文本实体数据链接 到步骤1中配电网故障处 理知识图谱 对应的实体数据; 步骤4, 若在步骤1中的配电网故障处理知识图谱中查询到与故障后运行方式保持一致 的配电网故障类型, 则返回故障类型与相应的处置要点信息; 否者, 人工辅助作出故障处 置。 2.根据权利要求1所述的基于知识型信 息抽取的配电网故障处理方法, 其特征在于, 所 述步骤4中, 若在所构建的配电网故障处理知识图谱中查询的故障类型与故障后运行方式 不一致时, 判断所输出 的配电网故障处理信息存在知识更新, 则将抽取后的新增文本实体 数据及类型 更新至配电网故障处 理知识图谱中, 形成更新后的配电网故障处 理知识图谱。 3.根据权利要求2所述的基于知识型信 息抽取的配电网故障处理方法, 其特征在于, 所 述步骤3中的预案文本分类采用TextCN N模型对预案文本进行分类和标注; 所述步骤3中的命名实体识别采用基于Lexicon  Rethinking机制的CNN模型对配电网 故障处理中的命名实体进 行识别和求解, 用于提取文本实体数据中的字符、 候选词特征, 并 利用Rethi nking机制将字符特 征和候选词特 征进行融合; 所述步骤3中的实体关系抽取采用具有双向门控循环BiGRUD的BiLSTM ‑Attention模 型, 利用Word2v ec作为词嵌入层, 将 输入文本实体数据转换为数值向量, 用于判定实体数据 之间是否存在预定义的关系。 4.根据权利要求1所述的基于知识型信 息抽取的配电网故障处理方法, 其特征在于, 将 抽取的文本实体数据 链接到所建立的配电网故障处理知识图谱对应的实体数据, 其具体方 法: 针对非结构化文本数据, 根据配电网设备台账数据中的设备名称, 建立配电网设备字 典, 利用欧氏距离算法, 通过字典中的实体匹配, 获得与所选实体相似性最大 的实体目标, 并将抽取实体与相应的实体进 行链接, 再通过关系数据库到RDF转换技术, 将现有的电力系 统关系数据库整合到新的配电网故障处 理知识图谱中。 5.根据权利要求2所述的基于知识型信 息抽取的配电网故障处理方法, 其特征在于, 所 述的知识更新包括模式层更新步骤和数据层更新步骤, 所述的模式层更新步骤是在当前模 式层中, 新增数据中出现新增类型时, 将新增类型更新到 当前模式层中; 其中的数据层更新 步骤是在当前模式层指导下, 将新增数据进 行知识抽取与知识融合后更新到配电网故障处 理知识图谱中。 6.根据权利要求1所述的基于知识型信 息抽取的配电网故障处理方法, 其特征在于, 所 建立的配电网故 障处理知识图谱采用Neo4j图数据库构建, 采用Cypher查询语句来搜索与 分析内容相符的信息 。 7.一种基于知识型信 息抽取的配电网故障处理系统, 其与 数据采集与监视控制系统连 接, 其特征在于, 所述系统包括知识图谱、 预 处理模块、 知识抽取模块、 知识融合模块和诊断 与处理模块, 所述预处理模块用于对包含的非结构化配电网故障信息转换为文本数据; 所权 利 要 求 书 1/2 页 2 CN 115292518 A 2述知识抽取模块用于对采集到的配电网故障处理信息进行文本 分类与实体关系抽取, 并通 过所述知识融合模块将抽取的文本实体数据 链接到所述知识图谱对应的实体数据上; 所述 诊断与处理模块用于判断在所述知识图谱中查询到的故障类型与故障后运行方式是否一 致, 若二者保持一致, 则 返回故障类型与相应的处置要点信息, 否者, 人工辅助作出故障处 置。 8.根据权利要求7所述的基于知识型信 息抽取的配电网故障处理系统, 其特征在于, 所 述系统还包括知识更新模块, 所述知识更新模块将抽取后的新增文本实体数据及类型更新 至所述知识图谱中, 形成更新后的配电网故障处 理知识图谱。 9.根据权利要求7所述的基于知识型信 息抽取的配电网故障处理系统, 其特征在于, 所 述知识抽取模块中包含有预案文本分类模块、 命名实体识别模块和实体关系抽取模块, 所 述预案文本 分类模块用于对预案文本进行分类和标注; 所述命名实体识别模块用于对配电 网故障处理中的命名实体进 行识别和求解, 提取文本实体数据中的字符、 候选词特征, 并利 用Rethinking机制将 字符特征和候选词特征进行融合; 所述 实体关系抽取模块用于判定实 体之间是否存在预定的关系。 10.一种计算机可读存储介质, 其特征在于, 所述存储介质中存储有至少一条程序代 码, 所述程序代码由处理器加载并执行, 以实现如权利要求1至6任一所述的基于知识型信 息抽取的配电网故障处 理方法。权 利 要 求 书 2/2 页 3 CN 115292518 A 3

PDF文档 专利 基于知识型信息抽取的配电网故障处理方法及系统

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于知识型信息抽取的配电网故障处理方法及系统 第 1 页 专利 基于知识型信息抽取的配电网故障处理方法及系统 第 2 页 专利 基于知识型信息抽取的配电网故障处理方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:14:08上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。