(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211270028.8
(22)申请日 2022.10.18
(71)申请人 江西电信 信息产业有限公司
地址 330000 江西省南昌市南昌经济技 术
开发区桂苑 大道 (创业大厦) 3楼
(72)发明人 尧德鹏 何美斌 陶俊 罗序俊
曾云松
(74)专利代理 机构 北京清亦华知识产权代理事
务所(普通 合伙) 11201
专利代理师 何世磊
(51)Int.Cl.
G06F 16/332(2019.01)
G06F 16/33(2019.01)
G06K 9/62(2022.01)
(54)发明名称
一种用户的意图识别方法及系统
(57)摘要
本发明提供了一种用户的意图识别方法及
系统, 该方法包括获取原始样本数据, 并根据原
始样本数据选取出第一样本数据集 以及第二样
本数据集; 根据第一样本数据集生成选择集, 并
将bert原始模型以及选择集输入至优化模块中,
以使优化模块输 出bert_variant最优模型; 根据
第二样本数据集生成训练集, 并将训练集输入至
bert_variant最优模型中, 以进行参数训练; 当
获取到语音指令时, 将语音指令转换成对应的文
本数据, 并将文本数据输入至训练完成的bert_
variant最优模型中, 以根据文本数据输出用户
的意图。 通过上述方式能够有效的降低推理时
延, 使之更加适用于实时交互场景, 提升了用户
的使用体验。
权利要求书3页 说明书11页 附图2页
CN 115329063 A
2022.11.11
CN 115329063 A
1.一种用户的意图识别方法, 其特 征在于, 所述方法包括:
获取根据用户的语音指令生成的原始样本数据, 并根据 所述原始样本数据选取出位于
不同时间段的第一样本数据集以及第二样本数据集;
根据所述第 一样本数据集生成对应的选择集, 并将bert原始模型以及所述选择集输入
至预设优化模块中, 以使所述优化模块输出b ert_variant最优模型, 所述选择集包括正样
本以及负 样本, 所述ber t原始模型包括若干层编码器;
根据所述第二样本数据集生成对应的训练集, 并将所述训练集输入至所述bert_
variant最优 模型中, 以对所述ber t_variant最优 模型进行参数训练;
当获取到用户实时输入的语音指令时, 将所述语音指令转换成对应的文本数据, 并将
所述文本数据输入至训练完成的bert_variant最优模型中, 以使训练完成的bert_variant
最优模型根据所述文本数据输出 所述用户的意图。
2.根据权利要求1所述的用户的意图识别方法, 其特征在于: 所述将bert原始模型以及
所述选择集输入至预设优化模块中, 以使 所述优化模块输出bert_var iant最优模 型的步骤
包括:
将所述正样本以及所述负样本均输入至所述bert原始模型中, 以对应获取到若干层所
述编码器分别输出的若干特 征向量;
建立所述正样本和所述负样本与若干所述特征向量之间的索引关系, 并根据若干所述
特征向量生成对应的特征向量集合, 以使所述优化模块根据所述特征向量集合输出所述
bert_variant最优 模型。
3.根据权利要求1所述的用户的意图识别方法, 其特征在于: 所述根据 所述第一样本数
据集生成对应的选择集的步骤 包括:
当获取到所述第一样本数据集时, 识别出所述第一样本数据集中包含的若干用户意
图, 并根据若干所述用户意图生成对应的若干数据组, 其中, 同一所述数据组内的两个数据
互为所述 正样本, 不同所述数据组内的任意两个数据互为所述负 样本;
根据若干所述数据组生成对应的若干样本集, 其中, 每一所述样本集均包括一待测样
本、 所述正样本以及所述负 样本, 且每一所述样本集均具有唯一 性;
对若干所述样本集进行整合处 理, 以生成所述选择集。
4.根据权利要求3所述的用户的意图识别方法, 其特征在于: 所述将bert原始模型以及
所述选择集输入至预设优化模块中, 以使 所述优化模块输出bert_var iant最优模 型的步骤
还包括:
依次遍历若干所述样本集以及若干层所述编码器, 并获取每一所述样本集中的待测样
本对应的编 码器输出的第一特征向量、 每一所述正样本对应的编 码器输出的第二特征向量
以及每一所述负 样本对应的编码器输出的第三特 征向量;
计算出所述第 一特征向量与 所述第二特征向量之间的第 一余弦相似度、 所述第 一特征
向量与所述第三特征向量之 间的第二余弦相似度, 并判断所述第一余弦相似度是否大于所
述第二余弦相似度;
若判断到所述第一 余弦相似度大于所述第二 余弦相似度, 则判定预测结果 正确;
若判断到所述第一 余弦相似度小于所述第二 余弦相似度, 则判定预测结果 错误。
5.根据权利要求1所述的用户的意图识别方法, 其特征在于: 所述将所述文本数据输入权 利 要 求 书 1/3 页
2
CN 115329063 A
2至训练完成的bert_variant最优模型中, 以使训练完成的bert_variant最优模型根据所述
文本数据输出 所述用户的意图的步骤之后, 所述方法还 包括:
当识别出所述用户的意图时, 根据所述意图生成对应的回复指令, 所述回复指令包括
若干关键词;
响应于所述回复指令, 调用出对应的文本数据库, 并在所述文本数据库中查找出对应
的回复文本, 以将所述回复文本实时显示在显示终端。
6.一种用户的意图识别系统, 其特 征在于, 所述系统包括:
获取模块, 用于获取根据用户的语音指令生成的原始样本数据, 并根据所述原始样本
数据选取 出位于不同时间段的第一样本数据集以及第二样本数据集;
处理模块, 用于根据所述第一样本数据集生成对应的选择集, 并将bert原始模型以及
所述选择集输入至预设优化模块中, 以使所述优化模块输出bert_variant最优模型, 所述
选择集包括 正样本以及负 样本, 所述ber t原始模型包括若干层编码器;
训练模块, 用于根据所述第二样本数据集生成对应的训练集, 并将所述训练集输入至
所述bert_variant最优 模型中, 以对所述ber t_variant最优 模型进行参数训练;
输出模块, 用于当获取到用户实时输入的语音指令时, 将所述语音指令转换成对应的
文本数据, 并将所述文本数据输入至训练完成的bert_variant最优模型中, 以使训练完成
的bert_variant最优 模型根据所述文本数据输出 所述用户的意图。
7.根据权利要求6所述的用户的意图识别系统, 其特 征在于: 所述处 理模块具体用于:
将所述正样本以及所述负样本均输入至所述bert原始模型中, 以对应获取到若干层所
述编码器分别输出的若干特 征向量;
建立所述正样本和所述负样本与若干所述特征向量之间的索引关系, 并根据若干所述
特征向量生成对应的特征向量集合, 以使所述优化模块根据所述特征向量集合输出所述
bert_variant最优 模型。
8.根据权利要求6所述的用户的意图识别系统, 其特征在于: 所述处理模块还具体用
于:
当获取到所述第一样本数据集时, 识别出所述第一样本数据集中包含的若干用户意
图, 并根据若干所述用户意图生成对应的若干数据组, 其中, 同一所述数据组内的两个数据
互为所述 正样本, 不同所述数据组内的任意两个数据互为所述负 样本;
根据若干所述数据组生成对应的若干样本集, 其中, 每一所述样本集均包括一待测样
本、 所述正样本以及所述负 样本, 且每一所述样本集均具有唯一 性;
对若干所述样本集进行整合处 理, 以生成所述选择集。
9.根据权利要求8所述的用户的意图识别系统, 其特征在于: 所述处理模块还具体用
于:
依次遍历若干所述样本集以及若干层所述编码器, 并获取每一所述样本集中的待测样
本对应的编 码器输出的第一特征向量、 每一所述正样本对应的编 码器输出的第二特征向量
以及每一所述负 样本对应的编码器输出的第三特 征向量;
计算出所述第 一特征向量与 所述第二特征向量之间的第 一余弦相似度、 所述第 一特征
向量与所述第三特征向量之 间的第二余弦相似度, 并判断所述第一余弦相似度是否大于所
述第二余弦相似度;权 利 要 求 书 2/3 页
3
CN 115329063 A
3
专利 一种用户的意图识别方法及系统
文档预览
中文文档
17 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-24 00:40:00上传分享