公共安全标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211022748.2 (22)申请日 2022.08.25 (71)申请人 中信百信银行股份有限公司 地址 100029 北京市朝阳区安定路5号院3 号楼8层 (72)发明人 董美  (74)专利代理 机构 北京市兰台律师事务所 11354 专利代理师 操飞越 张峰 (51)Int.Cl. G06F 16/33(2019.01) G06F 16/35(2019.01) G06F 16/36(2019.01) G06F 40/295(2020.01) G06K 9/62(2022.01)G06N 3/04(2006.01) G06N 3/08(2006.01) G06F 40/30(2020.01) (54)发明名称 一种面向金融领域知识图谱构建实体关系 抽取方法及系统 (57)摘要 本发明涉及一种面向金融领域知识图谱构 建实体关系抽取方法及系统, 包括: 获取领域数 据集; 将实体 关系抽取分解为关系分类与实体识 别; 将领域数据集的文本及关系标签输入至关系 分类模型进行关系分类, 得到关系分类输出结 果; 将关系分类输出结果以及序列标注标签输入 至实体识别模型, 得到实体识别输出结果; 将关 系分类输出结果与实体识别输出结果融合为金 融领域三元 组。 本发明所述方法及系统通过面向 金融领域知识 图谱构建使用深度学习的方法进 行实体关系抽取, 利用预训练模 型降低模型对数 据的需求量, 设计级 联结构数据中的重叠问题并 融合领域外部信息库辅助识别领域概念以及专 有名词。 权利要求书2页 说明书7页 附图4页 CN 115391487 A 2022.11.25 CN 115391487 A 1.一种面向金融领域知识图谱构建实体关系抽取 方法, 其特 征在于, 包括: S1、 获取领域数据集; S2、 将实体关系抽取分解 为关系分类与实体识别; S3、 将领域数据集的文本及关系标签输入至关系分类模型进行关系分类, 得到关系分 类输出结果; S4、 将关系分类输出结果以及序列标注标签输入至实体识别模型, 得到实体识别输出 结果; S5、 将关系分类输出 结果与实体识别输出 结果融合 为金融领域 三元组。 2.如权利要求1所述的方法, 其特 征在于, 所述 步骤S1包括分步骤: S11、 根据金融领域知识图谱目标, 确定需使用的语料 范围; S12、 获取需使用的语料; S13、 根据领域实体 类型以及领域关系类型制定实体关系抽取级联模型中的数据模型; S14、 根据 数实体关系抽取模型中的数据模型对需使用的语料进行处理, 得到领域数据 集。 3.如权利要求1所述的方法, 其特征在于, 所述领域数据集包括: 文本、 关系标签以及序 列标注标签。 4.如权利要求1所述的方法, 其特征在于, 所述实体关系抽取级联模型包括: 数据模型、 关系分类模型以及实体识别模型。 5.如权利要求1所述的方法, 其特征在于, 所述实体识别模型包括三层结构, 分别是: BERT层、 Bi ‑LSTM层以及CRF层; 第一层是BERT层, BERT层用于获得含有丰富语义的词向量; 第二层是Bi ‑LSTM层, Bi ‑LSTM层由双向的LSTM结构 构成, 用于捕捉文本的上 下文特征; 第三层是CRF层, CRF层为预测的标签添加约束保证预测标签的合法性; CRF层用于对输 出结果进行解码标注, 对实体进行提取分类。 6.如权利要求1所述的方法, 其特征在于, 所述实体关系抽取级联模型可解决实体对重 叠型句子、 单个实体重 叠型句子以及一句话中蕴含多种关系的多标签句子 。 7.一种面向金融领域知识图谱构建实体关系抽取系统, 其特 征在于, 包括: 数据集获取模块, 用于获取 领域数据集; 关系分类模块, 用于将领域数据集的文本及 关系标签输入至关系分类模型进行关系分 类, 得到关系分类输出 结果; 实体识别模块, 用于将关系分类输出结果以及序列标注标签输入至实体识别模型, 得 到实体识别输出 结果; 数据融合模块, 用于将关系分类输出结果与实体识别输出结果融合为金融领域三元 组。 8.如权利要求7 所述的系统, 其特 征在于, 数据集获取模块包括: 语料范围确定模块, 用于根据金融领域知识图谱目标, 确定需使用的语料 范围; 预料获取模块, 用于获取需使用的语料; 数据模型制定模块, 用于根据 领域实体类型以及领域关系类型制定实体关系抽取级联 模型中的数据模型;权 利 要 求 书 1/2 页 2 CN 115391487 A 2语料处理模块, 用于根据数实体关系抽取模型中的数据模型对需使用的语料进行处 理, 得到领域数据集。 9.一种计算机可读存储介质, 其特征在于, 所述存储介质上存储有计算机程序, 所述计 算机程序被处理器执行时实现权利要求1至6中任一项所述的面向金融领域知识图谱构建 实体关系抽取 方法。 10.一种电子设备, 其特 征在于, 包括处 理器和存 储器; 所述存储器, 用于存 储实体关系抽取级联模型; 所述处理器, 用于通过调用实体关系抽取级联模型, 执行权利要求1至6中任一项所述 的面向金融领域知识图谱构建实体关系抽取 方法。 11.一种计算机程序产品, 包括计算机程序和/或指令, 其特征在于, 该计算机程序和/ 或指令被处理器执行时实现权利要求1至6中任一项所述面向金融领域知识图谱构建实体 关系抽取 方法的步骤。权 利 要 求 书 2/2 页 3 CN 115391487 A 3

PDF文档 专利 一种面向金融领域知识图谱构建实体关系抽取方法及系统

文档预览
中文文档 14 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种面向金融领域知识图谱构建实体关系抽取方法及系统 第 1 页 专利 一种面向金融领域知识图谱构建实体关系抽取方法及系统 第 2 页 专利 一种面向金融领域知识图谱构建实体关系抽取方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:14:03上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。