公共安全标准网
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211012615.7 (22)申请日 2022.08.23 (71)申请人 连连银通电子支付有限公司 地址 310051 浙江省杭州市滨江区越达巷 79号1号楼1 1楼 申请人 连连 (杭州) 信息技 术有限公司 (72)发明人 王化楠 (74)专利代理 机构 广州三环 专利商标代理有限 公司 44202 专利代理师 郑华洁 (51)Int.Cl. G06F 16/36(2019.01) G06F 40/295(2020.01) G06K 9/62(2022.01) G06N 20/00(2019.01) (54)发明名称 一种知识图谱更新方法、 装置、 设备及存储 介质 (57)摘要 本申请涉及计算机技术领域, 尤其涉及一种 知识图谱更新方法、 装置、 设备及存储介质。 该方 法包括: 获取初始知识图谱, 并获取对象更新信 息; 对对象更新信息进行实体抽取, 得到实体集 合; 根据预定义规则对实体集合中的实体进行筛 选, 得到目标实体; 根据目标实体更新初始知识 图谱。 该知识图谱更新方法, 通过对抽取到的实 体进行筛选, 从而筛选出有效的目标实体, 然后 将目标实体更新到知识图谱中, 从而可以降低知 识图谱更新资源消耗, 提高知识图谱的更新效 率。 此外, 通过对更新到知识图谱中的实体进行 筛选, 可以减少无用更新到知识图谱中的无用信 息, 避免知识图谱过于泛化, 保证知识图谱的质 量。 权利要求书2页 说明书12页 附图5页 CN 115408534 A 2022.11.29 CN 115408534 A 1.一种知识图谱更新方法, 其特 征在于, 所述方法包括: 获取初始知识图谱, 并获取对象更新信息; 对所述对象更新信息进行实体抽取, 得到实体集 合; 根据预定义 规则对所述实体集 合中的实体进行筛 选, 得到目标实体; 根据所述目标实体更新所述初始知识图谱。 2.根据权利要求1所述的方法, 其特征在于, 所述对所述对象更新信息进行实体抽取, 得到实体集 合, 包括: 获取标注有实体标注结果的初始训练数据; 将所述初始训练数据输入机器模型, 得到所述机器模型输出的结果; 根据所述实体标注结果和所述机器模型输出的结果, 对所述机器模型进行训练, 得到 初始实体抽取模型; 将所述对象更新信 息输入到所述初始实体抽取模型中进行实体抽取, 得到实体抽取结 果; 根据所述实体抽取 结果确定所述实体集 合。 3.根据权利要求2所述的方法, 其特征在于, 所述对象更新信息包括多个对象更新数 据; 所述将所述对 象更新信息输入到所述初始实体抽取模型中进行实体抽取, 得到实体抽 取结果, 包括: 将所述对象更新信 息输入到所述初始实体抽取模型中进行实体抽取, 得到每个所述对 象更新数据对应的实体抽取 结果, 以及每 个所述实体抽取 结果的第一置信度信息; 根据所述第 一置信度信 息确定预设数量的目标实体抽取结果, 以及与 所述目标实体抽 取结果对应的目标对象更新数据; 基于所述初始训练数据和所述目标对象更新数据生成迭代训练数据; 将所述迭代训练数据输入所述初始实体抽取模型, 得到所述初始实体抽取模型输出的 结果; 根据所述实体标注结果、 所述目标实体抽取结果和所述初始实体抽取模型输出的结 果, 对所述初始实体抽取模型进行训练, 得到迭代实体抽取模型; 将至少一个非 目标对象更新数据输入到所述迭代实体抽取模型中, 得到每个所述非 目 标对象更新数据对应的非目标实体抽取结果; 所述非目标对象更新数据为所述对象更新信 息中除所述目标对象更新数据以外的目标对象数据; 根据所述目标实体抽取 结果和所述非目标实体抽取 结果, 确定所述实体抽取 结果。 4.根据权利要求3所述的方法, 其特征在于, 所述将至少一个非 目标对象更新数据输入 到所述迭代实体抽取模型中, 得到每个所述 非目标对象更新数据对应的非目标实体抽取结 果, 包括: 将至少一个非 目标对象更新数据输入到所述迭代实体抽取模型中, 得到每个所述非 目 标对象更新数据对应的非目标实体抽取结果, 以及每个所述 非目标实体抽取结果的第二置 信度信息; 根据所述第 二置信度信 息确定预设数量的所述目标实体抽取结果, 以及所述目标实体 抽取结果对应的目标对象更新数据; 重复所述基于所述初始训练数据和所述目标对象更新数据生成迭代训练数据, 至所述权 利 要 求 书 1/2 页 2 CN 115408534 A 2将至少一个非目标对象更新数据输入到所述迭代实体抽取模型中, 得到每个所述 非目标对 象更新数据对应的非目标实体抽取结果的步骤, 直至每个所述对象更新数据均为所述目标 对象更新数据; 基于每个所述目标对象更新数据对应的所述目标实体抽取结果, 得到所述实体抽取结 果。 5.根据权利要求1所述的方法, 其特征在于, 所述根据预定义规则对所述实体集合中的 实体进行筛 选, 得到目标实体, 包括: 确定所述实体集 合中每个实体的出现频次; 根据所述出现频次对所述实体集 合中的实体进行筛 选, 得到目标实体。 6.根据权利要求5所述的方法, 其特征在于, 所述根据所述目标实体更新所述初始知识 图谱之前, 所述方法还 包括: 对所述目标实体进行知识融合, 得到融合后的实体。 7.根据权利要求6所述的方法, 其特征在于, 所述根据所述目标实体更新所述初始知识 图谱, 包括: 基于所述融合后的实体建立 三元组; 确定所述 三元组中的对象实体; 在所述初始知识图谱的本体层中确定与所述对象实体对应的初始对象实体; 基于所述初始对象实体, 将所述 三元组更新到所述初始知识图谱中。 8.一种知识图谱更新装置, 其特 征在于, 所述装置包括: 获取模块, 用于获取初始知识图谱, 并获取对象更新信息; 实体抽取模块, 用于对所述对象更新信息进行实体抽取, 得到实体集 合; 实体筛选模块, 用于根据预定义规则对所述实体集合中的实体进行筛选, 得到目标实 体; 知识图谱更新模块, 用于根据所述目标实体更新所述初始知识图谱。 9.一种电子设备, 其特征在于, 所述设备包括处理器和存储器, 所述存储器中存储有至 少一条指 令或至少一段程序, 所述至少一条指 令或所述至少一段程序由所述处理器加载并 执行如权利要求1 ‑7任一项所述的知识图谱更新方法。 10.一种计算机可读存储介质, 其特征在于, 所述存储介质中存储有至少一条指令或至 少一段程序, 所述至少一条指 令或至少一段程序由处理器加载并执行以实现如权利要求 1‑ 7任一项所述的知识图谱更新方法。权 利 要 求 书 2/2 页 3 CN 115408534 A 3
专利 一种知识图谱更新方法、装置、设备及存储介质
文档预览
中文文档
20 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2元下载(无需注册)
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2元下载
本文档由 人生无常 于
2024-03-17 23:40:30
上传分享
举报
下载
原文档
(777.3 KB)
分享
友情链接
T-SHSSW 002—2024 长江口咸潮入侵应急监测技术导则.pdf
GB-T 37580-2019 聚乙烯 PE 埋地燃气管道腐蚀控制工程全生命周期要求.pdf
GB-T 34977-2017 信息安全技术 移动智能终端数据存储安全技术要求与测试评价方法.pdf
GB-T 25068.1-2020 信息技术 安全技术 网络安全 第1部分:综述和概念.pdf
T-CAS ES000000001—2022 工业品质量分级评价规则 通则.pdf
GB-T 22264.4-2022 安装式数字显示电测量仪表 第4部分:频率表的特殊要求.pdf
GB-T 35965.1-2018 应急信息交互协议 第1部分:预警信息.pdf
GB 18265-2019 危险化学品经营企业安全技术基本要求.pdf
GB-T 2315-2017 电力金具标称破坏载荷系列及连接型式尺寸.pdf
GB 21555-2008 烟花爆竹 双响(升空类产品).pdf
T-CVMA 45—2020 犬腺病毒PCR检测方法.pdf
GB-T 33561-2017 信息安全技术 安全漏洞分类.pdf
GB-T 20204-2006 水利水文自动化系统设备检验测试通用技术规范.pdf
数据安全及备份恢复测评指导书-二级V1.0.doc
GB-T 37408-2019 光伏发电并网逆变器技术要求.pdf
T-ZZB 1337—2019 无卤低烟阻燃耐火中压电力电缆.pdf
T-ACEF 037—2022 工业园区碳中和设计指南.pdf
T-CERDS 4—2022 企业ESG报告编制指南.pdf
GB-T 35009-2018 串行NAND型快闪存储器接口规范.pdf
GB-T 33850-2017信息技术服务质量评价指标体系.pdf
1
/
3
20
评价文档
赞助2元 点击下载(777.3 KB)
回到顶部
×
微信扫码支付
2
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。