公共安全标准网
文库搜索
切换导航
文件分类
频道
联系我们
问题反馈
文件分类
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211022748.2 (22)申请日 2022.08.25 (71)申请人 中信百信银行股份有限公司 地址 100029 北京市朝阳区安定路5号院3 号楼8层 (72)发明人 董美 (74)专利代理 机构 北京市兰台律师事务所 11354 专利代理师 操飞越 张峰 (51)Int.Cl. G06F 16/33(2019.01) G06F 16/35(2019.01) G06F 16/36(2019.01) G06F 40/295(2020.01) G06K 9/62(2022.01)G06N 3/04(2006.01) G06N 3/08(2006.01) G06F 40/30(2020.01) (54)发明名称 一种面向金融领域知识图谱构建实体关系 抽取方法及系统 (57)摘要 本发明涉及一种面向金融领域知识图谱构 建实体关系抽取方法及系统, 包括: 获取领域数 据集; 将实体 关系抽取分解为关系分类与实体识 别; 将领域数据集的文本及关系标签输入至关系 分类模型进行关系分类, 得到关系分类输出结 果; 将关系分类输出结果以及序列标注标签输入 至实体识别模型, 得到实体识别输出结果; 将关 系分类输出结果与实体识别输出结果融合为金 融领域三元 组。 本发明所述方法及系统通过面向 金融领域知识 图谱构建使用深度学习的方法进 行实体关系抽取, 利用预训练模 型降低模型对数 据的需求量, 设计级 联结构数据中的重叠问题并 融合领域外部信息库辅助识别领域概念以及专 有名词。 权利要求书2页 说明书7页 附图4页 CN 115391487 A 2022.11.25 CN 115391487 A 1.一种面向金融领域知识图谱构建实体关系抽取 方法, 其特 征在于, 包括: S1、 获取领域数据集; S2、 将实体关系抽取分解 为关系分类与实体识别; S3、 将领域数据集的文本及关系标签输入至关系分类模型进行关系分类, 得到关系分 类输出结果; S4、 将关系分类输出结果以及序列标注标签输入至实体识别模型, 得到实体识别输出 结果; S5、 将关系分类输出 结果与实体识别输出 结果融合 为金融领域 三元组。 2.如权利要求1所述的方法, 其特 征在于, 所述 步骤S1包括分步骤: S11、 根据金融领域知识图谱目标, 确定需使用的语料 范围; S12、 获取需使用的语料; S13、 根据领域实体 类型以及领域关系类型制定实体关系抽取级联模型中的数据模型; S14、 根据 数实体关系抽取模型中的数据模型对需使用的语料进行处理, 得到领域数据 集。 3.如权利要求1所述的方法, 其特征在于, 所述领域数据集包括: 文本、 关系标签以及序 列标注标签。 4.如权利要求1所述的方法, 其特征在于, 所述实体关系抽取级联模型包括: 数据模型、 关系分类模型以及实体识别模型。 5.如权利要求1所述的方法, 其特征在于, 所述实体识别模型包括三层结构, 分别是: BERT层、 Bi ‑LSTM层以及CRF层; 第一层是BERT层, BERT层用于获得含有丰富语义的词向量; 第二层是Bi ‑LSTM层, Bi ‑LSTM层由双向的LSTM结构 构成, 用于捕捉文本的上 下文特征; 第三层是CRF层, CRF层为预测的标签添加约束保证预测标签的合法性; CRF层用于对输 出结果进行解码标注, 对实体进行提取分类。 6.如权利要求1所述的方法, 其特征在于, 所述实体关系抽取级联模型可解决实体对重 叠型句子、 单个实体重 叠型句子以及一句话中蕴含多种关系的多标签句子 。 7.一种面向金融领域知识图谱构建实体关系抽取系统, 其特 征在于, 包括: 数据集获取模块, 用于获取 领域数据集; 关系分类模块, 用于将领域数据集的文本及 关系标签输入至关系分类模型进行关系分 类, 得到关系分类输出 结果; 实体识别模块, 用于将关系分类输出结果以及序列标注标签输入至实体识别模型, 得 到实体识别输出 结果; 数据融合模块, 用于将关系分类输出结果与实体识别输出结果融合为金融领域三元 组。 8.如权利要求7 所述的系统, 其特 征在于, 数据集获取模块包括: 语料范围确定模块, 用于根据金融领域知识图谱目标, 确定需使用的语料 范围; 预料获取模块, 用于获取需使用的语料; 数据模型制定模块, 用于根据 领域实体类型以及领域关系类型制定实体关系抽取级联 模型中的数据模型;权 利 要 求 书 1/2 页 2 CN 115391487 A 2语料处理模块, 用于根据数实体关系抽取模型中的数据模型对需使用的语料进行处 理, 得到领域数据集。 9.一种计算机可读存储介质, 其特征在于, 所述存储介质上存储有计算机程序, 所述计 算机程序被处理器执行时实现权利要求1至6中任一项所述的面向金融领域知识图谱构建 实体关系抽取 方法。 10.一种电子设备, 其特 征在于, 包括处 理器和存 储器; 所述存储器, 用于存 储实体关系抽取级联模型; 所述处理器, 用于通过调用实体关系抽取级联模型, 执行权利要求1至6中任一项所述 的面向金融领域知识图谱构建实体关系抽取 方法。 11.一种计算机程序产品, 包括计算机程序和/或指令, 其特征在于, 该计算机程序和/ 或指令被处理器执行时实现权利要求1至6中任一项所述面向金融领域知识图谱构建实体 关系抽取 方法的步骤。权 利 要 求 书 2/2 页 3 CN 115391487 A 3
专利 一种面向金融领域知识图谱构建实体关系抽取方法及系统
文档预览
中文文档
14 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助2元下载(无需注册)
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2元下载
本文档由 SC 于
2024-03-03 12:14:03
上传分享
举报
下载
原文档
(778.2 KB)
分享
友情链接
GB-T 28637-2012 电动采光排烟天窗.pdf
GB-T 42374-2023 大众滑雪赛事活动等级划分与评定规范.pdf
T-CERS 0002—2018 3.6kV~40.5kV交流金属封闭开关 设备和控制设备 环保气体.pdf
GB-T 27011-2019 合格评定 认可机构要求.pdf
T-ZZB 0372—2018 全息防伪产品.pdf
DB61-T 1358-2020 曳引驱动家用电梯检验规范 陕西省.pdf
GB-T 17901.3-2021 信息技术 安全技术 密钥管理 第3部分:采用非对称技术的机制.pdf
YD-T 4301-2023 量子保密通信网络架构.pdf
GB-T 42467.8-2023 中医临床名词术语 第8部分:眼科学.pdf
GB-T 24581-2022 硅单晶中III、V族杂质含量的测定 低温傅立叶变换红外光谱法.pdf
GB-T 24917-2010 眼镜阀.pdf
2023-01-09 汽车信息安全法律法规及标准全景图V3.0.pdf
阿里云 云原生架构白皮书.pdf
GB-T 17713-2022 吸油烟机及其他烹饪烟气吸排装置.pdf
DB34-T 4686-2024 挥发性有机物走航监测技术规范 安徽省.pdf
DB3713-T 208-2020 普通住宅前期物业管理服务等级划分 临沂市.pdf
GB-T 7666-2005 传感器命名法及代号.pdf
GB-T 23776-2018 茶叶感官审评方法.pdf
GB-T 39853.1-2021 供电系统中的电能质量测量 第1部分:电能质量监测设备(PQI).pdf
GB-Z 43030-2023 低压开关设备和控制设备 网络安全.pdf
交流群
-->
1
/
14
评价文档
赞助2元 点击下载(778.2 KB)
回到顶部
×
微信扫码支付
2
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。