公共安全标准网
文库搜索
切换导航
文件分类
频道
联系我们
问题反馈
文件分类
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210985878.X (22)申请日 2022.08.16 (71)申请人 阳光保险集团股份有限公司 地址 518000 广东省深圳市福田区红荔西 路7002号第一世界广场A座17层 (72)发明人 张晗 杜新凯 吕超 谷姗姗 (74)专利代理 机构 北京超凡宏宇专利代理事务 所(特殊普通 合伙) 11463 专利代理师 荣颖佳 (51)Int.Cl. G06F 40/30(2020.01) G06N 3/08(2006.01) (54)发明名称 意图识别模 型的训练方法、 意图识别方法及 装置 (57)摘要 本申请提供了一种意图识别模型的训练方 法、 意图识别方法及装置, 方法包括: 获取训练样 本集; 训练样本集中的样本包括: 标注有意图标 签的问句; 采用训练样本集中的样 本对预训练模 型进行训练; 获取样本对应的初始输出向量; 根 据初始输出向量确定预训练模型的初始反向传 播梯度; 基于初始反向传播梯度, 对初始输出向 量增加预设次数的扰动, 得到目标反向传播梯 度; 根据目标反向传播梯度更新预训练模型的模 型参数, 得到意图识别模型。 本申请利用预训练 模型中反向传播的梯度, 对模型样 本对应的输出 向量, 即词嵌入层向量进行对抗扰动, 这种对抗 训练方法可以提高模型鲁棒 性。 权利要求书2页 说明书9页 附图4页 CN 115270815 A 2022.11.01 CN 115270815 A 1.一种意图识别模型的训练方法, 其特 征在于, 所述方法包括: 获取训练样本集; 所述训练样本集中的样本包括: 标注有意图标签的问句; 采用所述训练样本集中的样本对预训练模型进行训练; 获取所述样本对应的初始输出向量; 根据所述初始输出向量确定所述预训练模型的初始反向传播梯度; 基于所述初始反向传播梯度, 对所述初始输出向量增加预设次数的扰动, 得到目标反 向传播梯度; 根据所述目标反向传播梯度更新所述预训练模型的模型参数, 得到意图识别模型。 2.根据权利要求1所述的方法, 其特征在于, 基于所述初始反向传播梯度, 对所述初始 输出向量增 加预设次数的扰动, 得到目标反向传播梯度的步骤, 包括: 以所述初始反向传播梯度作为当前梯度, 执 行以下扰动操作: 根据所述当前梯度计算当前扰动向量; 以所述当前扰动向量和所述初始输出向量之和作为目标输出向量; 根据所述目标输出向量及当前扰动次数确定当前梯度增量; 以所述当前梯度增量和所述当前梯度之和, 更新所述当前梯度, 继续执行所述扰动操 作, 直至所述当前扰动次数达到所述预设次数时, 将所述当前梯度增量和所述当前梯度之 和作为目标反向传播梯度。 3.根据权利要求2所述的方法, 其特征在于, 根据 所述当前梯度计算当前扰动向量的步 骤, 包括: 根据下式计算当前扰动向量: 其中, r0表示当前扰动向量; ∈表示预设正数, 很小的一个正数; sgn表示符号函数; 表示当前梯度; y0表示初始输出向量; L表示损失函数; θ,x,y分别表示模型参数、 模型输入 向量和模型输出向量。 4.根据权利要求2所述的方法, 其特征在于, 根据 所述目标输出向量及当前扰动次数确 定当前梯度增量的步骤, 包括: 根据所述目标输出向量和损失函数计算目标损失值; 基于所述目标损失值进行 前后向传播处 理, 得到目标梯度; 利用下式计算当前梯度增量: 其中, Δ0表示当前梯度增量, 表示目标梯度; y1表示目标输 出向量; d表示衰减因子; t表示当前扰动次数。 5.根据权利要求1所述的方法, 其特征在于, 根据 所述初始输出向量确定所述预训练模 型的初始反向传播梯度的步骤, 包括: 根据所述初始输出向量和损失函数, 计算所述样本对应的初始损失值; 根据所述初始损失值进行反向传播, 得到所述预训练模型的初始反向传播梯度。 6.根据权利要求1所述的方法, 其特 征在于, 获取训练样本集的步骤, 包括:权 利 要 求 书 1/2 页 2 CN 115270815 A 2从对话系统日志中获取多个用户输入文本; 对多个所述用户输入文本进行 预处理, 得到表达用户意图的多个目标文本; 对每个所述目标文本标注意图标签, 得到包含有多个标注有意图标签的问句的训练样 本集。 7.根据权利要求1所述的方法, 其特征在于, 根据 所述目标反 向传播梯度 更新所述预训 练模型的模型参数的步骤之后, 还 包括: 获取验证样本集; 通过所述验证样本集对参数 更新后的模型进行验证; 当验证结果满足指定条件时, 将参数 更新后的模型作为 意图识别模型。 8.一种意图识别方法, 其特 征在于, 所述方法包括: 获取待识别文本; 将所述待识别文本输入至预设的意图识别模型; 所述意图识别模型为采用如权利要求 1‑7任一项所述的方法训练得到的模型; 通过所述意图识别模型输出用于表征 所述待识别文本对应意图的输出向量。 9.一种意图识别模型的训练装置, 其特 征在于, 所述装置包括: 样本集获取模块, 用于获取训练样本集; 所述训练样本集中的样本包括: 标注有意图标 签的问句; 输出向量获取模块, 用于采用所述训练样本集中的样本对预训练模型进行训练, 获取 所述样本对应的初始输出向量; 梯度确定模块, 用于根据所述初始输出向量确定所述预训练模型的初始反向传播梯 度; 扰动模块, 用于基于所述初始反向传播梯度, 对所述初始输出向量增加预设次数的扰 动, 得到目标反向传播梯度; 参数更新模块, 用于根据所述目标反向传播梯度更新所述预训练模型的模型参数, 得 到意图识别模型。 10.一种意图识别装置, 其特 征在于, 所述装置包括: 文本获取模块, 用于获取待识别文本; 文本输入模块, 用于将所述待识别文本输入至预设的意图识别模型; 所述意图识别模 型为采用如权利要求1 ‑7任一项所述的方法训练得到的模型; 模型预测模块, 用于通过所述意图识别模型对所述待识别文本进行预测, 输出用于表 征所述待识别文本对应意图的输出向量。权 利 要 求 书 2/2 页 3 CN 115270815 A 3
专利 意图识别模型的训练方法、意图识别方法及装置
文档预览
中文文档
16 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助2元下载(无需注册)
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2元下载
本文档由 SC 于
2024-03-03 12:14:09
上传分享
举报
下载
原文档
(786.2 KB)
分享
友情链接
阿里巴巴 毕玄 从自动化到智能化的阿里运维体系.pdf
GB-T 38395-2019 煤焦油 硫和氮含量的测定.pdf
T-SDL 3.5—2021 10 kV智能电缆系统技术规范 第 5 部分 安装与验收规范.pdf
T-GDAEPI 01—2019 固定污染源自动监控系统运行服务规范.pdf
GB-T 33009.1-2016工业自动化和控制系统网络安全集散控制系统(DCS)第1部分防护要求.pdf
T-ACEF 105—2023 公民绿色低碳行为温室气体减排量化指南 行:骑行.pdf
GB-T 41986-2022 全钒液流电池 设计导则.pdf
T-SIOT 023—2021 工业物联网安全网闸技术要求.pdf
GB-T 24108-2009 岩土工程仪器可靠性技术要求.pdf
TB-T 3210.1-2020 铁路煤炭运输抑尘技术条件 第1部分:抑尘剂.pdf
GB-T 23950-2009 无机化工产品中重金属测定通用方法.pdf
T-CTSS 40—2021 新昌县茶产业数字化信息采集技术规范.pdf
DB3310-T 93-2022 公共数据授权运营指南 台州市.pdf
GB-T 2440-2017 尿素.pdf
T-CXZCX 001—2023 餐饮外卖一次性密封规范.pdf
JR-T 0070-2012 信用增进机构风险管理规范.pdf
GB-T 43690-2024 成像衍射光学元件衍射效率的测量方法.pdf
T-CSTM 01094—2023 材料基因工程 合金扩散偶制备元数据.pdf
奇安信 2022中国实战化白帽人才能力白皮书.pdf
ISO 9241 820 2024 Ergonomics of human system interaction Part 820 Ergonomic guidance on interzctions in immersive environments including augmented reality and virtual reality.pdf
交流群
-->
1
/
16
评价文档
赞助2元 点击下载(786.2 KB)
回到顶部
×
微信扫码支付
2
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。