公共安全标准网
文库搜索
切换导航
文件分类
频道
联系我们
问题反馈
文件分类
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210954746.0 (22)申请日 2022.08.10 (71)申请人 中译语通科技股份有限公司 地址 100043 北京市石景山区石景山路20 号16层16 01 (72)发明人 郑志军 陈自岩 程国艮 (74)专利代理 机构 北京绘聚高科知识产权代理 事务所(普通 合伙) 11832 专利代理师 张春慧 (51)Int.Cl. G06F 40/205(2020.01) G06F 40/30(2020.01) G06F 40/126(2020.01) G06F 16/33(2019.01) (54)发明名称 事件关系的抽取方法、 装置、 电子设备和存 储介质 (57)摘要 本申请提供了一种事件关系的抽取方法、 装 置、 电子设备和存储介质, 所述方法包括: 所述方 法包括: 将目标文本输入监督学习模型, 得到编 码后的多个时序序列, 其中, 每个所述时序序列 指示所述文本中包含当前字符上下文语义信息 的编码向量; 对每个所述时序序列进行解码, 得 到事件论元的半指针矩 阵和事件关系的半指针 矩阵, 其中, 所述事件论元的半指针矩阵的每个 元素能够表示一个字符指代的一个论元的类型 角色, 事件关系的半指针矩阵的每个元素能够表 示一个字符指代的一个事件的关系角色; 基于对 所述事件论元的半指针矩阵、 所述事件关系的半 指针矩阵的解析, 抽取出事件角色和事件对的关 系。 本申请提高事件角色和事件关系抽取的准确 率。 权利要求书2页 说明书8页 附图4页 CN 115358209 A 2022.11.18 CN 115358209 A 1.一种事 件关系的抽取 方法, 其特 征在于, 所述方法包括: 将目标文本输入监督学习模型, 得到编码后的多个时序序列, 其中, 每个所述时序序列 指示所述文本中包 含当前字符的上 下文语义信息的编码向量; 对每个所述时序序列进行解码, 得到事件论元的半指针矩阵和事件关系的半指针矩 阵, 其中, 所述事件论元 的半指针矩阵的每个元素能够表示一个字符指代的一个论元 的类 型角色, 所述事件关系的半指 针矩阵的每个元素能够表示一个字符指代的一个事件的关系 角色; 基于对所述事件论元的半指针矩阵、 所述事件关系的半指针矩阵的解析, 抽取出事件 角色和事 件关系。 2.根据权利要求1所述的方法, 其特征在于, 所述对每个所述时序序列进行解码, 得到 事件论元的半指针矩阵和事 件关系的半指针矩阵包括: 对所述时序序列进行解码, 得到事件论元的两个半指针矩阵Role ‑start‑Matrix、 Role‑end‑Matrix, 其中, 所述Role ‑start‑Matrix指示论元的起始位置, 所述Role ‑end‑ Matrix指示论元的结束位置; 根据所述 时序序列和所述事件论元的两个半指针矩阵, 得到事件关系的两个半指针矩 阵Relation ‑start‑Matrix、 Relation ‑end‑Matrix, 其中, 所述Relation ‑start‑Matrix指 示关系的起始位置, 所述Relati on‑end‑Matrix指示关系的结束位置 。 3.根据权利要求2所述的方法, 其特征在于, 根据 所述时序序列和所述事件论元的两个 半指针矩阵, 得到事 件关系的两个半指针矩阵包括: 通过对所述事件论元的两个半指针矩阵的解析, 得到字符为任意一种论元的论元概 率; 确定所述时序 序列、 所述 论元概率的乘积和所述时序 序列的加 和结果; 通过对所述加 和结果和所述时序 序列进行解码, 得到事 件关系的两个半指针矩阵。 4.根据权利要求1所述的方法, 其特征在于, 所述事件论元的半指针矩阵中, 每行代表 一个字符, 长度为n, 每列代表一个论元的类型角色, 长度为len(event)*len(论元), 其中, len(event)表示事 件的类型个数, len(论元)表示 论元的类型个数。 5.根据权利要求1所述的方法, 其特征在于, 所述事件关系的半指针矩阵中, 每行代表 一个字符, 长度为n, 每列代表一个事件的关系角色, 长度为len(event)*len(关系), 其中, len(event)表示事 件的类型个数, len(关系)表示事 件关系的个数。 6.根据权利要求2所述的方法, 其特征在于, 所述基于对所述多个半指针矩阵的解析, 抽取出事件论元和事 件的因果关系包括: 基于对所述事 件论元的两个半指针矩阵的解析, 抽取事 件论元和论元角色; 基于对所述事 件关系的两个半指针矩阵的解析, 抽取事 件关系和事 件的关系角色。 7.根据权利要求2所述的方法, 其特征在于, 将目标文本输入监督学习模型之前, 所述 方法还包括: 获取初始文本; 对所述初始文本进行预处理, 得到预处理后的目标文本, 其中, 所述预处理包括删除乱 码内容和干扰内容。 8.一种事 件关系的抽取装置, 其特 征在于, 所述装置包括:权 利 要 求 书 1/2 页 2 CN 115358209 A 2输入输出模块, 将 目标文本输入监督学习模型, 得到编码后的多个时序序列, 其中, 每 个所述时序 序列指示所述文本中包 含当前字符的上 下文语义信息的编码向量; 解码模块, 用于对每个所述时序序列进行解码, 得到事件论元的半指针矩阵和事件关 系的半指针矩阵, 其中, 所述事件论元 的半指针矩阵的每个元素能够表示一个字符指代的 一个论元的类型角色, 事件关系的半指 针矩阵的每个元素能够表示一个字符指代的一个事 件的关系角色; 解析模块, 用于基于对所述事件论元的半指针矩阵、 所述事件关系的半指针矩阵的解 析, 抽取出事件角色和事 件关系。 9.一种电子设备, 其特征在于, 包括处理器、 通信接口、 存储器和通信总线, 其中, 处理 器, 通信接口, 存 储器通过通信总线完成相互间的通信; 存储器, 用于存放计算机程序; 处理器, 用于执 行存储器上所存放的程序时, 实现权利要求1 ‑7任一所述的方法步骤。 10.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质内存储有计算机 程序, 所述计算机程序被处 理器执行时实现权利要求1 ‑7任一所述的方法步骤。权 利 要 求 书 2/2 页 3 CN 115358209 A 3
专利 事件关系的抽取方法、装置、电子设备和存储介质
文档预览
中文文档
15 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助2元下载(无需注册)
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2元下载
本文档由 SC 于
2024-03-03 12:14:14
上传分享
举报
下载
原文档
(593.1 KB)
分享
友情链接
GB-T 43201.5-2023 工业自动化系统与集成 生产系统工程的标准化程序 第5部分:制造变更管理.pdf
奇安信 自动化渗透测试系统-主打PPT.pdf
ISO IEC 27033-6-2016.pdf
DB61-T 983-2015 旧水泥混凝土路面共振碎石化技术规范 陕西省.pdf
T-SDL 3.2—2021 10 kV智能电缆系统技术规范 第 2 部分 智能电缆测控系统终端.pdf
DB45-T 2129-2020 美丽乡村 人畜分离管理规范 广西壮族自治区.pdf
GB-T 39725-2020 信息安全技术 健康医疗数据安全指南.pdf
GW0103-2014 国家电子政务外网 安全等级保护基本要求.pdf
T-GDCA 023—2023 化妆品用原料 二裂酵母发酵产物溶胞产物.pdf
DB37-T 4074—2020 山东省美丽村居建设标准 山东省.pdf
DB34-T 4102-2022 废旧锂离子动力蓄电池贮存安全技术条件 安徽省.pdf
信通院 数据清洗、去标识化、匿名化业务规程 试行.pdf
GM-T 0006-2012 密码应用标识规范.pdf
信通院 助力抗击疫情保障复工复产云服务产品应用参考指南.pdf
GB-T 30303-2013 工业用甲胺和甲胺水溶液试验方法.pdf
YD-T 4194-2023 5G终端基于NR的语音解决方案(VoNR)技术要求.pdf
GB-T 6312-2022 壁厚千分尺.pdf
GB-T 24554-2022 燃料电池发动机性能试验方法.pdf
DB4413-T 35-2023 金线莲栽培技术规范 惠州市.pdf
SY-T 5820-2020 天然源电磁法采集技术规程.pdf
交流群
-->
1
/
15
评价文档
赞助2元 点击下载(593.1 KB)
回到顶部
×
微信扫码支付
2
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。