专利 意图识别模型的训练方法、意图识别方法及装置

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210985878.X (22)申请日 2022.08.16 (71)申请人阳光保险集团股份有限公司地址 518000 广东省深圳市福田区红荔西路7002号第一世界广场A座17层 (72)发明人张晗　杜新凯　吕超　谷姗姗　 (74)专利代理机构北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 专利代理师荣颖佳 (51)Int.Cl. G06F 40/30(2020.01) G06N 3/08(2006.01) (54)发明名称意图识别模型的训练方法、意图识别方法及装置 (57)摘要本申请提供了一种意图识别模型的训练方法、意图识别方法及装置，方法包括：获取训练样本集；训练样本集中的样本包括：标注有意图标签的问句；采用训练样本集中的样本对预训练模型进行训练；获取样本对应的初始输出向量；根据初始输出向量确定预训练模型的初始反向传播梯度；基于初始反向传播梯度，对初始输出向量增加预设次数的扰动，得到目标反向传播梯度；根据目标反向传播梯度更新预训练模型的模型参数，得到意图识别模型。本申请利用预训练模型中反向传播的梯度，对模型样本对应的输出向量，即词嵌入层向量进行对抗扰动，这种对抗训练方法可以提高模型鲁棒性。权利要求书2页说明书9页附图4页 CN 115270815 A 2022.11.01 CN 115270815 A 1.一种意图识别模型的训练方法，其特征在于，所述方法包括：获取训练样本集；所述训练样本集中的样本包括：标注有意图标签的问句；采用所述训练样本集中的样本对预训练模型进行训练；获取所述样本对应的初始输出向量；根据所述初始输出向量确定所述预训练模型的初始反向传播梯度；基于所述初始反向传播梯度，对所述初始输出向量增加预设次数的扰动，得到目标反向传播梯度；根据所述目标反向传播梯度更新所述预训练模型的模型参数，得到意图识别模型。 2.根据权利要求1所述的方法，其特征在于，基于所述初始反向传播梯度，对所述初始输出向量增加预设次数的扰动，得到目标反向传播梯度的步骤，包括：以所述初始反向传播梯度作为当前梯度，执行以下扰动操作：根据所述当前梯度计算当前扰动向量；以所述当前扰动向量和所述初始输出向量之和作为目标输出向量；根据所述目标输出向量及当前扰动次数确定当前梯度增量；以所述当前梯度增量和所述当前梯度之和，更新所述当前梯度，继续执行所述扰动操作，直至所述当前扰动次数达到所述预设次数时，将所述当前梯度增量和所述当前梯度之和作为目标反向传播梯度。 3.根据权利要求2所述的方法，其特征在于，根据所述当前梯度计算当前扰动向量的步骤，包括：根据下式计算当前扰动向量：其中， r0表示当前扰动向量； ∈表示预设正数，很小的一个正数； sgn表示符号函数；表示当前梯度； y0表示初始输出向量； L表示损失函数； θ,x,y分别表示模型参数、模型输入向量和模型输出向量。 4.根据权利要求2所述的方法，其特征在于，根据所述目标输出向量及当前扰动次数确定当前梯度增量的步骤，包括：根据所述目标输出向量和损失函数计算目标损失值；基于所述目标损失值进行前后向传播处理，得到目标梯度；利用下式计算当前梯度增量：其中， Δ0表示当前梯度增量，表示目标梯度； y1表示目标输出向量； d表示衰减因子； t表示当前扰动次数。 5.根据权利要求1所述的方法，其特征在于，根据所述初始输出向量确定所述预训练模型的初始反向传播梯度的步骤，包括：根据所述初始输出向量和损失函数，计算所述样本对应的初始损失值；根据所述初始损失值进行反向传播，得到所述预训练模型的初始反向传播梯度。 6.根据权利要求1所述的方法，其特征在于，获取训练样本集的步骤，包括：权　利　要　求　书 1/2 页 2 CN 115270815 A 2从对话系统日志中获取多个用户输入文本；对多个所述用户输入文本进行预处理，得到表达用户意图的多个目标文本；对每个所述目标文本标注意图标签，得到包含有多个标注有意图标签的问句的训练样本集。 7.根据权利要求1所述的方法，其特征在于，根据所述目标反向传播梯度更新所述预训练模型的模型参数的步骤之后，还包括：获取验证样本集；通过所述验证样本集对参数更新后的模型进行验证；当验证结果满足指定条件时，将参数更新后的模型作为意图识别模型。 8.一种意图识别方法，其特征在于，所述方法包括：获取待识别文本；将所述待识别文本输入至预设的意图识别模型；所述意图识别模型为采用如权利要求 1‑7任一项所述的方法训练得到的模型；通过所述意图识别模型输出用于表征所述待识别文本对应意图的输出向量。 9.一种意图识别模型的训练装置，其特征在于，所述装置包括：样本集获取模块，用于获取训练样本集；所述训练样本集中的样本包括：标注有意图标签的问句；输出向量获取模块，用于采用所述训练样本集中的样本对预训练模型进行训练，获取所述样本对应的初始输出向量；梯度确定模块，用于根据所述初始输出向量确定所述预训练模型的初始反向传播梯度；扰动模块，用于基于所述初始反向传播梯度，对所述初始输出向量增加预设次数的扰动，得到目标反向传播梯度；参数更新模块，用于根据所述目标反向传播梯度更新所述预训练模型的模型参数，得到意图识别模型。 10.一种意图识别装置，其特征在于，所述装置包括：文本获取模块，用于获取待识别文本；文本输入模块，用于将所述待识别文本输入至预设的意图识别模型；所述意图识别模型为采用如权利要求1 ‑7任一项所述的方法训练得到的模型；模型预测模块，用于通过所述意图识别模型对所述待识别文本进行预测，输出用于表征所述待识别文本对应意图的输出向量。权　利　要　求　书 2/2 页 3 CN 115270815 A 3

专利 意图识别模型的训练方法、意图识别方法及装置

专利意图识别模型的训练方法、意图识别方法及装置