(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210916567.8
(22)申请日 2022.08.01
(71)申请人 北京伽睿智能科技 集团有限公司
地址 100192 北京市海淀区西小口路6 6号
中关村东升科技园 ·北领地C-1楼1层
106(东升地区)
(72)发明人 姜晓丹 张晶 王双 张成凯
樊辉 安军刚 韩兴源 傅天隆
吕子祺
(74)专利代理 机构 北京华清迪源知识产权代理
有限公司 1 1577
专利代理师 丁彦峰
(51)Int.Cl.
G06F 16/332(2019.01)
G06F 16/33(2019.01)G06F 40/289(2020.01)
G06F 40/30(2020.01)
G06K 9/62(2022.01)
G06N 3/04(2006.01)
G10L 15/22(2006.01)
G10L 15/26(2006.01)
(54)发明名称
基于语音识别的人机交 互学习方法及系统
(57)摘要
本申请公开了一种基于语音识别的人机交
互学习方法及系统, 将问题进行原子化拆分, 用
关键词联系为带权有向图结构, 通过训练和优
化, 使得图中的子图树形结构中的信息最多且关
键词子树更精简有效从而满足教学场景使用的
问答技术, 然后根据模型得到规则序列; 将得到
的规则序列进行训练, 从而匹配问答规则, 实现
问答流程并且进行过程打分输出最佳结果。 解决
了现有的智能问答系统无法对应答内容进行评
判和评分, 无法告诉对话者在对话过程中所说内
容是否符合标准流程规范、 是否出现问题, 无法
有效应用于客服人机虚拟对 联场景, 无法满足学
习者的教学场景使用的问题。
权利要求书3页 说明书8页 附图4页
CN 115292461 A
2022.11.04
CN 115292461 A
1.一种基于语音识别的人机交 互学习方法, 其特 征在于, 包括:
接收用户输入的问答指令;
判断所述问答指令是语音指令还是文本指令;
若所述问答指令为语音指令, 则将语音内容 转化为文本内容, 并编码为字符串数据;
若所述问答指令为文本指令, 则直接将文本内容编码为字符串数据;
将字符串数据中的语料内容通过编码后分词切割处理成文本向量, 通过文本向量计算
进行比对并抽取实体关系;
根据确定的实体关系 判断知识库是否有答案;
若知识库能查询到答案, 则将知识库中的答案返回至问答界面;
若知识库未能查询到答案, 则通过实体意图词频和语义关系将文本间带权有向图结构
转化为规则序列, 分析话术预警意图无歧义后, 将候选意图中所配置的标准文本转换为向
量, 学习生成两个文本的余弦相似度高 内容为得到匹配答案, 并返回至问答界面;
根据设定的评分规则对用户的答复进行打 分并返回至问答界面。
2.根据权利要求1所述的基于语音识别的人机交互学习方法, 其特征在于, 所述将字符
串数据中的语料内容通过编 码后分词切割处理成文本向量, 通过文本向量计算进 行比对并
抽取实体关系, 具体为:
获取字符串数据中的语料内容, 并进行语料类型编码;
根据第一公式和第二公式计算关系抽取算法的双向特 征输入序列;
所述第一公式为:
其中, xi为字符串数据中含有的人工设置的语料内容, pi表示输入的字符串数据序列中
第i个位序内容的类型概率, α表示当前输入的语料类型文本编码中第一个语料类型概率
值;
所述第二公式为:
其中,
表示从输入的上一个带标签的语料类型到下一个带标签类型转移矩阵中的特征
值, (xi,pi)表示输入的内容的编码值和该输入类型中i位置的类型概率值的行列式,
表
示输入内容编码值的行特征内容值和列特征类型值, β 表示从xi输入中根据α与β 的转移矩
阵特征变化关系预测出的下一句中文本编码中的语料内容关系类型概率值, pi‑1表示输入
当前编码类型值和下一句的编码类型值后按照随机条件场计算出下一个语料类型的预测
概率值;
根据第三公式计算句子对应的关系标签 类型概率;
所述第三公式为:权 利 要 求 书 1/3 页
2
CN 115292461 A
2其中, δ为输入序列中前后两种语料类型的关系标签值, χ为前后两种语料类型关系类
型预测概率值;
根据第四公式计算输出序列的关系标签概 率值得分;
所述第四公式为:
其中, C为输入 xi中总语料类型 数,
为当前被分析句中不同组合 χ;
将得分最高的语料内容 顺序依次排列为输出实体。
3.根据权利要求2所述的基于语音识别的人机交互学习方法, 其特征在于, 所述语料内
容包括欢迎语 类型W、 介绍语 类型M或感谢语类型N。
4.根据权利要求1所述的基于语音识别的人机交互学习方法, 其特征在于, 所述匹配答
案, 具体为:
为输出的问题匹配答案, i表示图卷积上的节点与第一个提问有关的所有语料
内容, r表示邻接节点的关系边是语料内不同的类型 关系数, j属于Nr
i表示节点i与邻接点的
边关系为r的集合, ci,r为上述语料类型关系值的绝对值, Wr(l)表示同类型边邻接节点同类
型语料的文本编码权重, W0(l)表示图上第一个起始点同类型边邻接节点 间同类型语料的文
本编码权重, hi(l)为当前问题输入的语料内容, R为一句话的所有类型
组合数, σ 表示句子
长短的距离设置参数, h(l)
j为图中关联邻接当前问答语料内容的下一句语料内容。
5.根据权利要求1所述的基于语音识别的人机交互学习方法, 其特征在于, 所述评分规
则包括: 标准 流程、 话术、 词语和匹配度。
6.根据权利要求1所述的基于语音识别的人机交 互学习方法, 其特 征在于, 还 包括:
根据对话过程回答的错误的次数、 种类和内容来评估业务能力, 得出综合评价以及建
议的培训方案 。
7.根据权利要求1所述的基于语音识别的人机交互学习方法, 其特征在于, 所述匹配答
案和所述打 分通过文本的形式返回至问答界面。
8.一种基于语音识别的人机交 互学习系统, 其特 征在于, 包括:
问答界面模块, 用于 接收用户输入的问答指令并展示问答结果;
语音处理模块, 用于判断所述问答指令是语音指令还是文本指令;
若所述问答指令为语音指令, 则将语音内容 转化为文本内容, 并编码为字符串数据;
若所述问答指令为文本指令, 则直接将文本内容编码为字符串数据;
知识规则模块, 用于将字符串数据中的语料内容通过编码后分词切割处理成文本向权 利 要 求 书 2/3 页
3
CN 115292461 A
3
专利 基于语音识别的人机交互学习方法及系统
文档预览
中文文档
16 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-03-03 12:14:21上传分享