公共安全标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211270028.8 (22)申请日 2022.10.18 (71)申请人 江西电信 信息产业有限公司 地址 330000 江西省南昌市南昌经济技 术 开发区桂苑 大道 (创业大厦) 3楼 (72)发明人 尧德鹏 何美斌 陶俊 罗序俊  曾云松  (74)专利代理 机构 北京清亦华知识产权代理事 务所(普通 合伙) 11201 专利代理师 何世磊 (51)Int.Cl. G06F 16/332(2019.01) G06F 16/33(2019.01) G06K 9/62(2022.01) (54)发明名称 一种用户的意图识别方法及系统 (57)摘要 本发明提供了一种用户的意图识别方法及 系统, 该方法包括获取原始样本数据, 并根据原 始样本数据选取出第一样本数据集 以及第二样 本数据集; 根据第一样本数据集生成选择集, 并 将bert原始模型以及选择集输入至优化模块中, 以使优化模块输 出bert_variant最优模型; 根据 第二样本数据集生成训练集, 并将训练集输入至 bert_variant最优模型中, 以进行参数训练; 当 获取到语音指令时, 将语音指令转换成对应的文 本数据, 并将文本数据输入至训练完成的bert_ variant最优模型中, 以根据文本数据输出用户 的意图。 通过上述方式能够有效的降低推理时 延, 使之更加适用于实时交互场景, 提升了用户 的使用体验。 权利要求书3页 说明书11页 附图2页 CN 115329063 A 2022.11.11 CN 115329063 A 1.一种用户的意图识别方法, 其特 征在于, 所述方法包括: 获取根据用户的语音指令生成的原始样本数据, 并根据 所述原始样本数据选取出位于 不同时间段的第一样本数据集以及第二样本数据集; 根据所述第 一样本数据集生成对应的选择集, 并将bert原始模型以及所述选择集输入 至预设优化模块中, 以使所述优化模块输出b ert_variant最优模型, 所述选择集包括正样 本以及负 样本, 所述ber t原始模型包括若干层编码器; 根据所述第二样本数据集生成对应的训练集, 并将所述训练集输入至所述bert_ variant最优 模型中, 以对所述ber t_variant最优 模型进行参数训练; 当获取到用户实时输入的语音指令时, 将所述语音指令转换成对应的文本数据, 并将 所述文本数据输入至训练完成的bert_variant最优模型中, 以使训练完成的bert_variant 最优模型根据所述文本数据输出 所述用户的意图。 2.根据权利要求1所述的用户的意图识别方法, 其特征在于: 所述将bert原始模型以及 所述选择集输入至预设优化模块中, 以使 所述优化模块输出bert_var iant最优模 型的步骤 包括: 将所述正样本以及所述负样本均输入至所述bert原始模型中, 以对应获取到若干层所 述编码器分别输出的若干特 征向量; 建立所述正样本和所述负样本与若干所述特征向量之间的索引关系, 并根据若干所述 特征向量生成对应的特征向量集合, 以使所述优化模块根据所述特征向量集合输出所述 bert_variant最优 模型。 3.根据权利要求1所述的用户的意图识别方法, 其特征在于: 所述根据 所述第一样本数 据集生成对应的选择集的步骤 包括: 当获取到所述第一样本数据集时, 识别出所述第一样本数据集中包含的若干用户意 图, 并根据若干所述用户意图生成对应的若干数据组, 其中, 同一所述数据组内的两个数据 互为所述 正样本, 不同所述数据组内的任意两个数据互为所述负 样本; 根据若干所述数据组生成对应的若干样本集, 其中, 每一所述样本集均包括一待测样 本、 所述正样本以及所述负 样本, 且每一所述样本集均具有唯一 性; 对若干所述样本集进行整合处 理, 以生成所述选择集。 4.根据权利要求3所述的用户的意图识别方法, 其特征在于: 所述将bert原始模型以及 所述选择集输入至预设优化模块中, 以使 所述优化模块输出bert_var iant最优模 型的步骤 还包括: 依次遍历若干所述样本集以及若干层所述编码器, 并获取每一所述样本集中的待测样 本对应的编 码器输出的第一特征向量、 每一所述正样本对应的编 码器输出的第二特征向量 以及每一所述负 样本对应的编码器输出的第三特 征向量; 计算出所述第 一特征向量与 所述第二特征向量之间的第 一余弦相似度、 所述第 一特征 向量与所述第三特征向量之 间的第二余弦相似度, 并判断所述第一余弦相似度是否大于所 述第二余弦相似度; 若判断到所述第一 余弦相似度大于所述第二 余弦相似度, 则判定预测结果 正确; 若判断到所述第一 余弦相似度小于所述第二 余弦相似度, 则判定预测结果 错误。 5.根据权利要求1所述的用户的意图识别方法, 其特征在于: 所述将所述文本数据输入权 利 要 求 书 1/3 页 2 CN 115329063 A 2至训练完成的bert_variant最优模型中, 以使训练完成的bert_variant最优模型根据所述 文本数据输出 所述用户的意图的步骤之后, 所述方法还 包括: 当识别出所述用户的意图时, 根据所述意图生成对应的回复指令, 所述回复指令包括 若干关键词; 响应于所述回复指令, 调用出对应的文本数据库, 并在所述文本数据库中查找出对应 的回复文本, 以将所述回复文本实时显示在显示终端。 6.一种用户的意图识别系统, 其特 征在于, 所述系统包括: 获取模块, 用于获取根据用户的语音指令生成的原始样本数据, 并根据所述原始样本 数据选取 出位于不同时间段的第一样本数据集以及第二样本数据集; 处理模块, 用于根据所述第一样本数据集生成对应的选择集, 并将bert原始模型以及 所述选择集输入至预设优化模块中, 以使所述优化模块输出bert_variant最优模型, 所述 选择集包括 正样本以及负 样本, 所述ber t原始模型包括若干层编码器; 训练模块, 用于根据所述第二样本数据集生成对应的训练集, 并将所述训练集输入至 所述bert_variant最优 模型中, 以对所述ber t_variant最优 模型进行参数训练; 输出模块, 用于当获取到用户实时输入的语音指令时, 将所述语音指令转换成对应的 文本数据, 并将所述文本数据输入至训练完成的bert_variant最优模型中, 以使训练完成 的bert_variant最优 模型根据所述文本数据输出 所述用户的意图。 7.根据权利要求6所述的用户的意图识别系统, 其特 征在于: 所述处 理模块具体用于: 将所述正样本以及所述负样本均输入至所述bert原始模型中, 以对应获取到若干层所 述编码器分别输出的若干特 征向量; 建立所述正样本和所述负样本与若干所述特征向量之间的索引关系, 并根据若干所述 特征向量生成对应的特征向量集合, 以使所述优化模块根据所述特征向量集合输出所述 bert_variant最优 模型。 8.根据权利要求6所述的用户的意图识别系统, 其特征在于: 所述处理模块还具体用 于: 当获取到所述第一样本数据集时, 识别出所述第一样本数据集中包含的若干用户意 图, 并根据若干所述用户意图生成对应的若干数据组, 其中, 同一所述数据组内的两个数据 互为所述 正样本, 不同所述数据组内的任意两个数据互为所述负 样本; 根据若干所述数据组生成对应的若干样本集, 其中, 每一所述样本集均包括一待测样 本、 所述正样本以及所述负 样本, 且每一所述样本集均具有唯一 性; 对若干所述样本集进行整合处 理, 以生成所述选择集。 9.根据权利要求8所述的用户的意图识别系统, 其特征在于: 所述处理模块还具体用 于: 依次遍历若干所述样本集以及若干层所述编码器, 并获取每一所述样本集中的待测样 本对应的编 码器输出的第一特征向量、 每一所述正样本对应的编 码器输出的第二特征向量 以及每一所述负 样本对应的编码器输出的第三特 征向量; 计算出所述第 一特征向量与 所述第二特征向量之间的第 一余弦相似度、 所述第 一特征 向量与所述第三特征向量之 间的第二余弦相似度, 并判断所述第一余弦相似度是否大于所 述第二余弦相似度;权 利 要 求 书 2/3 页 3 CN 115329063 A 3

PDF文档 专利 一种用户的意图识别方法及系统

文档预览
中文文档 17 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种用户的意图识别方法及系统 第 1 页 专利 一种用户的意图识别方法及系统 第 2 页 专利 一种用户的意图识别方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-24 00:40:00上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。