(19)国家知识产权局
(12)发明 专利
(10)授权公告 号
(45)授权公告日
(21)申请 号 202210074609.8
(22)申请日 2022.01.21
(65)同一申请的已公布的文献号
申请公布号 CN 114090762 A
(43)申请公布日 2022.02.25
(73)专利权人 浙商期货有限公司
地址 310000 浙江省杭州市西湖区天目山
路198号财通双冠 大厦东楼 9-12层
(72)发明人 杨胜利 吴福文 康维鹏
(74)专利代理 机构 杭州创智卓英知识产权代理
事务所(普通 合伙) 33324
专利代理师 张迪
(51)Int.Cl.
G06F 16/332(2019.01)
G06F 16/33(2019.01)
G06F 16/35(2019.01)
G06F 40/295(2020.01)G06F 40/30(2020.01)
G06Q 40/04(2012.01)
G06Q 40/06(2012.01)
(56)对比文件
WO 2021189921 A1,2021.09.3 0
CN 113408298 A,2021.09.17
CN 109885660 A,2019.0 6.14
WO 2021100902 A1,2021.0 5.27
US 2020210491 A1,2020.07.02
曹建奇.基 于自然语言处 理的主观 题自动评
分系统的研究与实现. 《中国优秀硕士学位 论文
全文数据库(电子期刊)》 .2016,第I138-7 749页.
Glavas,G.等.Is Supervised Syntactic
Parsing Beneficial for Langua ge
Understandi ng? An Empirical
Investigation. 《arXiv》 .2020,全 文.
审查员 程一峰
(54)发明名称
一种期货领域的自动问答方法和系统
(57)摘要
本申请涉及一种期货领域的自动问答方法
和系统, 其中, 该方法包括: 通过获取问题语句,
根据期货实体列表对问题语句进行 实体识别, 根
据连续的若干问题语句的实体识别结果, 对问题
语句进行上下文补充, 得到补充后的问题语句,
对补充后的问题 语句进行问句子块划分, 从问句
子块中通过焦点识别得到权重最大的问句主子
块, 通过深度学习算法对问句主子块进行问句类
型识别, 得到问题语句的类别标签, 根据问题语
句的类别标签 分别进行相应的深层语义理解, 进
而从期货问答知识库数据中查询获取到相关数
据进行答案封装, 通过本申请, 解决了相关技术
中期货领域的自动应答精确度低的问题, 实现了
对期货领域中多种类别的问题进行精准应答。
权利要求书3页 说明书14页 附图6页
CN 114090762 B
2022.06.03
CN 114090762 B
1.一种期 货领域的自动问答方法, 其特 征在于, 所述方法包括:
获取问题语句, 根据期货实体列表对所述问题语句进行实体识别, 其中, 所述期货实体
列表是根据期 货问答知识库数据构建得到的;
根据连续时序上若干所述问题语句 的实体识别结果, 对所述问题语句进行上下文补
充, 得到补充后的问题语句;
通过CRF序列标注法对所述问题语句进行Chunk切分得到若干问句子块, 并计算所述问
句子块的权 重信息, 按所述权 重信息排序得到 权重最大的问句主子块;
通过深度 学习算法对所述问句主子块进行问句类型识别, 得到所述问题语句的类别标
签;
根据所述问题语句的类别标签分别进行相应的深层语义理解, 进而从所述期货问答知
识库数据中查询获取到相关数据进行答案 封装。
2.根据权利要求1所述的方法, 其特征在于, 根据期货问答知识库数据构建期货实体列
表, 根据所述期 货实体列表对所述问题语句进行实体识别包括:
根据期货问答知识库 数据中的期货实体语义类别、 期货实体同义表述和期货实体语义
属性, 构建期 货实体列表;
根据SQL字段同义表述和SQ L查询关键 字, 构建SQ L查询列表;
根据所述期货实体列表和所述SQL查询列表, 构建字典树对所述问题语句进行最大前
缀匹配识别;
通过正则表达 式对所述问题语句进行时间数字识别, 并通过预设开源分词工具对所述
问题语句进行分词识别。
3.根据权利要求1所述的方法, 其特征在于, 根据 所述问题语句的类别标签分别进行相
应的深层语义理解, 进而从所述期货问答知识库数据中查询获取到相关数据进行答案封装
包括:
若所述问题语句的类别标签为资讯研报类, 则根据所述问题语句的实体识别结果, 将
所述问题语句解析成若干类型的查询Query, 根据所述查询Qu ery从所述期货问答知识库数
据中获取最佳候选文档, 并进行 段落摘要 按预设图标样式完成答案 封装;
若所述问题语句的类别标签为结构化查询类, 则根据所述问题语句通过相似匹配模型
确定对应的数据库表, 根据所述问题语句和所述数据库 表中的字段确定SQL查询字段和SQL
查询条件, 进而组合得到SQL查询语句从所述期货问答知识库数据中获取最佳候选数据, 按
预设图标样式完成答案 封装;
若所述问题语句的类别标签为常见客服类, 则通过TextCNN分类模型确定所述问题语
句在所述常见客服类中的候选类别, 再通过K ‑NRM相似模型计算得到所述候选类别下相似
度最大的候选问题, 从所述期货问答知识库数据中获取最佳答案, 按预设图标样 式完成答
案封装。
4.根据权利要求1所述的方法, 其特征在于, 通过深度学习算法对所述问句主子块进行
问句类型识别, 得到所述问题语句的类别标签包括:
通过word2vec词向量工具计算得到所述问题语句的问句主子块的词向量;
根据资讯研报类词 表、 结构化查询类词 表和常见客服类词表, 构 建TextCNN分类模型并
迭代训练;权 利 要 求 书 1/3 页
2
CN 114090762 B
2根据所述词向量通过训练好的所述TextCNN分类模型进行问句分类, 得到所述问题语
句的类别标签, 其中, 所述类别标签包括资 讯研报类、 结构化 查询类和常见客 服类。
5.根据权利要求1所述的方法, 其特征在于, 根据连续 时序上若干所述问题语句的实体
识别结果, 对所述问题语句进行 上下文补充包括:
根据连续 时序上当前问题语句的实体识别结果, 判断所述当前问题语句是否满足预设
句式规则;
若满足, 则遍历所述连续时序上其他问题语句的实体识别结果, 判断所述其他问题语
句与所述当前问题语句是否存在 省略关系;
若存在, 则对所述当前问题语句进行 上下文补充。
6.根据权利要求3所述的方法, 其特征在于, 根据所述问题语句的实体识别结果, 将所
述问题语句解析成若干类型的查询Qu ery, 根据所述查询Query从所述期货问答知识库数据
中获取最佳候选文档包括:
根据所述问题语句的实体识别结果, 将所述问题语句解析成时间查询Query、 研报查询
Query、 品种查询Query、 意向查询Query、 标题查询Query和内容 查询Query;
将若干所述查询Query按OR逻辑组装成最终查询Query, 从所述期货问答知识库数据中
获取候选文档;
通过K‑NRM模型计算所述候选文档与所述最终查询Query的相似度, 得到相似度最大的
最佳候选文档。
7.根据权利要求1所述的方法, 其特征在于, 根据 所述问题语句通过相似 匹配模型确定
对应的数据库表, 根据所述问题语句和所述数据库表中的字段确定SQL查询字段和SQL查询
条件, 进而组合得到SQ L查询语句从所述期 货问答知识库数据中获取最佳候选数据包括:
通过Biaffine双仿射模型计算所述问题语句与数据库表的对齐语义特征信息并判断
是否关联匹配, 确定对应的数据库表;
根据问题语句中的实体与所述数据库表中的字段确定SQ L查询字段;
通过Biaffine双仿射模型计算所述问题语句中的实体与所述数据库表中的字段的对
齐分值确定SQ L查询条件;
根据SQL语法规则, 将所述数据库表、 所述SQL查询字段和所述SQL查询条件组合得到
SQL查询语句, 从所述期 货问答知识库数据中获取最佳候选数据。
8.根据权利要求1所述的方法, 其特征在于, 在根据期货问答知识库 数据构建期货 实体
列表之前, 所述方法还 包括:
获取用于对期货和现货的市场行情、 产能结构和未来走势进行分析研究的资讯研报类
数据, 获取期 货交易中产生的结构化数据, 获取基础 知识性的常见客 服类数据;
根据所述资 讯研报类数据、 结构化数据和常见客 服类数据, 建立期 货问答知识库数据。
9.一种期货领域的自动问答系统, 其特征在于, 所述系统包括获取模块、 浅层语义理解
模块、 深层语义理解模块和回复响应模块;
所述获取模块获取问题语句;
所述浅层语义理解模块根据期货实体列表对所述问题语句进行实体识别, 其中, 所述
期货实体列 表是根据期货问答知识库数据构建得到的; 再根据连续时序上若干所述问题语
句的实体识别 结果, 对所述问题语句进行上下文补充, 得到补充后的问题语句, 通过CRF序权 利 要 求 书 2/3 页
3
CN 114090762 B
3
专利 一种期货领域的自动问答方法和系统
文档预览
中文文档
24 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共24页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:33:48上传分享