专利 基于语音识别的人机交互学习方法及系统

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210916567.8 (22)申请日 2022.08.01 (71)申请人北京伽睿智能科技集团有限公司地址 100192 北京市海淀区西小口路6 6号中关村东升科技园 ·北领地C-1楼1层 106(东升地区) (72)发明人姜晓丹　张晶　王双　张成凯　樊辉　安军刚　韩兴源　傅天隆　吕子祺　 (74)专利代理机构北京华清迪源知识产权代理有限公司 1 1577 专利代理师丁彦峰 (51)Int.Cl. G06F 16/332(2019.01) G06F 16/33(2019.01)G06F 40/289(2020.01) G06F 40/30(2020.01) G06K 9/62(2022.01) G06N 3/04(2006.01) G10L 15/22(2006.01) G10L 15/26(2006.01) (54)发明名称基于语音识别的人机交互学习方法及系统 (57)摘要本申请公开了一种基于语音识别的人机交互学习方法及系统，将问题进行原子化拆分，用关键词联系为带权有向图结构，通过训练和优化，使得图中的子图树形结构中的信息最多且关键词子树更精简有效从而满足教学场景使用的问答技术，然后根据模型得到规则序列；将得到的规则序列进行训练，从而匹配问答规则，实现问答流程并且进行过程打分输出最佳结果。解决了现有的智能问答系统无法对应答内容进行评判和评分，无法告诉对话者在对话过程中所说内容是否符合标准流程规范、是否出现问题，无法有效应用于客服人机虚拟对联场景，无法满足学习者的教学场景使用的问题。权利要求书3页说明书8页附图4页 CN 115292461 A 2022.11.04 CN 115292461 A 1.一种基于语音识别的人机交互学习方法，其特征在于，包括：接收用户输入的问答指令；判断所述问答指令是语音指令还是文本指令；若所述问答指令为语音指令，则将语音内容转化为文本内容，并编码为字符串数据；若所述问答指令为文本指令，则直接将文本内容编码为字符串数据；将字符串数据中的语料内容通过编码后分词切割处理成文本向量，通过文本向量计算进行比对并抽取实体关系；根据确定的实体关系判断知识库是否有答案；若知识库能查询到答案，则将知识库中的答案返回至问答界面；若知识库未能查询到答案，则通过实体意图词频和语义关系将文本间带权有向图结构转化为规则序列，分析话术预警意图无歧义后，将候选意图中所配置的标准文本转换为向量，学习生成两个文本的余弦相似度高内容为得到匹配答案，并返回至问答界面；根据设定的评分规则对用户的答复进行打分并返回至问答界面。 2.根据权利要求1所述的基于语音识别的人机交互学习方法，其特征在于，所述将字符串数据中的语料内容通过编码后分词切割处理成文本向量，通过文本向量计算进行比对并抽取实体关系，具体为：获取字符串数据中的语料内容，并进行语料类型编码；根据第一公式和第二公式计算关系抽取算法的双向特征输入序列；所述第一公式为：其中， xi为字符串数据中含有的人工设置的语料内容， pi表示输入的字符串数据序列中第i个位序内容的类型概率， α表示当前输入的语料类型文本编码中第一个语料类型概率值；所述第二公式为：其中，表示从输入的上一个带标签的语料类型到下一个带标签类型转移矩阵中的特征值， (xi,pi)表示输入的内容的编码值和该输入类型中i位置的类型概率值的行列式，表示输入内容编码值的行特征内容值和列特征类型值， β 表示从xi输入中根据α与β 的转移矩阵特征变化关系预测出的下一句中文本编码中的语料内容关系类型概率值， pi‑1表示输入当前编码类型值和下一句的编码类型值后按照随机条件场计算出下一个语料类型的预测概率值；根据第三公式计算句子对应的关系标签类型概率；所述第三公式为：权　利　要　求　书 1/3 页 2 CN 115292461 A 2其中， δ为输入序列中前后两种语料类型的关系标签值， χ为前后两种语料类型关系类型预测概率值；根据第四公式计算输出序列的关系标签概率值得分；所述第四公式为：其中， C为输入 xi中总语料类型数，为当前被分析句中不同组合 χ；将得分最高的语料内容顺序依次排列为输出实体。 3.根据权利要求2所述的基于语音识别的人机交互学习方法，其特征在于，所述语料内容包括欢迎语类型W、介绍语类型M或感谢语类型N。 4.根据权利要求1所述的基于语音识别的人机交互学习方法，其特征在于，所述匹配答案，具体为：为输出的问题匹配答案， i表示图卷积上的节点与第一个提问有关的所有语料内容， r表示邻接节点的关系边是语料内不同的类型关系数， j属于Nr i表示节点i与邻接点的边关系为r的集合， ci,r为上述语料类型关系值的绝对值， Wr(l)表示同类型边邻接节点同类型语料的文本编码权重， W0(l)表示图上第一个起始点同类型边邻接节点间同类型语料的文本编码权重， hi(l)为当前问题输入的语料内容， R为一句话的所有类型组合数， σ 表示句子长短的距离设置参数， h(l) j为图中关联邻接当前问答语料内容的下一句语料内容。 5.根据权利要求1所述的基于语音识别的人机交互学习方法，其特征在于，所述评分规则包括：标准流程、话术、词语和匹配度。 6.根据权利要求1所述的基于语音识别的人机交互学习方法，其特征在于，还包括：根据对话过程回答的错误的次数、种类和内容来评估业务能力，得出综合评价以及建议的培训方案。 7.根据权利要求1所述的基于语音识别的人机交互学习方法，其特征在于，所述匹配答案和所述打分通过文本的形式返回至问答界面。 8.一种基于语音识别的人机交互学习系统，其特征在于，包括：问答界面模块，用于接收用户输入的问答指令并展示问答结果；语音处理模块，用于判断所述问答指令是语音指令还是文本指令；若所述问答指令为语音指令，则将语音内容转化为文本内容，并编码为字符串数据；若所述问答指令为文本指令，则直接将文本内容编码为字符串数据；知识规则模块，用于将字符串数据中的语料内容通过编码后分词切割处理成文本向权　利　要　求　书 2/3 页 3 CN 115292461 A 3

专利 基于语音识别的人机交互学习方法及系统

专利基于语音识别的人机交互学习方法及系统