公共安全标准网
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211064264.4 (22)申请日 2022.09.01 (71)申请人 华为技术有限公司 地址 518129 广东省深圳市龙岗区坂田华 为总部办公楼 申请人 中国人民大 学 (72)发明人 袁珺 王刚 董振华 徐君 (74)专利代理 机构 北京亿腾知识产权代理事务 所(普通合伙) 11309 专利代理师 陈霁 (51)Int.Cl. G06F 16/9535(2019.01) G06F 16/33(2019.01) G06N 3/08(2006.01) (54)发明名称 多路召回模型训练方法、 多路召回方法、 装 置及电子设备 (57)摘要 一种多路召回模型训练方法、 多路召回方 法、 装置及电子设备, 涉及人工智能技术领域。 多 路召回模型包括M个单路召回模型, 该训练方法 包括获取多组训练数据, 每组训练数据包括检索 词对应的目标正样本和多个负样本; 通过第M ‑1 个单路召回模型获取各组训练数据中所有样本 的相关性分数, 然后根据该相关性分数以及第一 损失函数进行数据拟合, 确定第M个单路召回模 型的第一期望召回结果, 第一损失函数用于确定 第M‑1个单路召回模型的损失; 根据第一期望召 回结果及第二损失函数, 确定第M个单路召回模 型的损失; 以该损失最小为目标, 训练第M个单路 召回模型。 这样使得第M个单路召回模型能够尽 可能弥补第M个模型的损失, 以提升多路召回模 型的整体召回效果。 权利要求书4页 说明书22页 附图6页 CN 115374362 A 2022.11.22 CN 115374362 A 1.一种多路召回模型训练方法, 其特征在于, 所述多路召回模型包括M个单路召回模 型, M≥2, 所述训练方法包括: 获取多组训练数据, 每组训练数据包括检索词对应的目标正样本和多个负样本, 每个 样本包括所述检索词和对应文档; 通过第M‑1个单路召回模型, 获取各组训练数据中所有样本的相关性分数, 所述相关性 分数表征对应样本中的文档与所述检索词的匹配程度; 根据各组所述训练数据的相关性分数, 以及第一损 失函数, 进行数据拟合, 确定第M个 单路召回模型的第一期望召回结果, 所述第一损失函数用于确定所述第M ‑1个单路召回模 型在召回对应训练数据时与第二期望召回结果之间的偏差; 根据第一期望召回结果以及第 二损失函数, 确定第M个单路召回模型的损失, 所述损失 表示第M个单路召回模型在召回对应训练数据时与所述第一期望召回结果之间的偏差; 以所述损失最小为目标, 训练所述第M个单路召回模型。 2.根据权利要求1所述的训练方法, 其特征在于, 在所述以所述损 失最小为目标, 训练 所述第M个单路召回模型之后, 所述训练方法还 包括: 根据各组训练数据, 第一权重, 第 二权重以及代 理函数, 确定预设的神经网络模型的总 损失, 其中, 预设的神经网络模型包括所述M个单路召回模型, 所述总损失表征该神经网络 模型的输出数据与期望输出数据之间的误差, 第一权重包括M ‑1个, M‑1个第一权重分别为 第1至第M ‑1个单路召回模型的权 重, 第二权 重为所述第M个单路召回模型的权 重; 调节所述第二权 重的值, 以向着所述总损失最小的方向, 对该神经网络模型进行训练; 将停止训练时所述总损 失对应的第二权重的值, 确定为所述第M个单路召回模型的目 标权重。 3.根据权利要求2所述的训练方法, 其特征在于, 所述将停止训练时所述总损失对应的 第二权重的值, 确定为第M个单路召回模型的目标权 重, 包括: 将对所述神经网络模型每 轮训练过程中的总损失的值, 有序地 放入一个定 长序列; 当预设时长内, 所述定长序列中最大值和最小值的差值的变量率低于预设阈值, 停止 训练; 将停止训练时对应的第二权 重的值, 确定为所述目标权 重。 4.根据权利要求1 ‑3任一所述的训练方法, 其特征在于, 所述获取多组训练数据中, 包 括: 通过预设的召回模型, 获取基于所述检索词召回的多个文档的相关性分数, 其中, 所述 多个文档来自预设的数据集, 所述数据集为包括若干与所述检索词相关的文档的集合, 且 该集合中的部分文档是 标注为正样本的文档; 将所述多个文档按照其相关性分数由大到小的顺序排列后, 将排在前T位且未标注为 正样本的文档, 确定为第一负 样本; 利用多个所述第一负样本, 形成负样本集, 以根据负样本集和所述正样本得到所述训 练数据。 5.根据权利要求1 ‑3任一所述的训练方法, 其特征在于, 所述获取多组训练数据中, 还 包括: 利用第一模型, 获取基于所述检索词从数据集召回的所有文档的相关性分数, 其中, 所权 利 要 求 书 1/4 页 2 CN 115374362 A 2述数据集包括 正样本集和负 样本集, 其中, 负 样本集中包括多个负 样本; 根据召回的所有文档的相关性分数, 确定目标样本, 目标样本为根据其相关性分数达 到预设值且标注错 误的样本; 根据所述负样本集中所有负样本对应的文档的相关性分数, 获取所述所有负样本的概 率分布数据; 根据所述概率分布数据, 选取所述负样本集中分布于预设值域内的负样本, 作为第二 负样本, 以使第二负样本和所述正样本集形成所述训练数据, 其中第二负样本中不包括 目 标样本。 6.一种多路召回方法, 其特征在于, 所述方法通过多路召回模型实现, 所述多路召回模 型包括M个单路召回模型, M≥2, 所述多路召回方法包括: 将检索词分别 输入多路召回模型中的各个所述单路召回模型中, 得到各个所述单路召 回模型的第一召回结果; 利用各个单路召回模型对应的权重, 对各个所述第一召回结果进行融合, 得到第二召 回结果。 7.一种多路召回模型训练装置, 其特征在于, 所述多路召回模型包括M个单路召回模 型, M≥2, 所述训练装置包括: 第一获取模型, 用于获取多组训练数据, 每组训练数据包括检索词对应的目标正样本 和多个负 样本, 每个样本包括所述检索词和对应文档; 第一处理模块, 用于通过第M ‑1个单路召回模型, 获取各组训练数据中所有样本的相关 性分数, 所述相关性分数表征对应样本中的文档与所述检索词的匹配程度; 所述第一处理模块, 还用于根据各组所述训练数据的相关性分数, 以及第 一损失函数, 进行数据拟合, 确定第M个单路召回模 型的第一期 望召回结果, 所述第一损失函数用于确定 所述第M‑1个单路召回模型在召回对应训练数据时与第二期望召回结果之间的偏差; 所述第一处理模块, 还用于根据第 一期望召回结果以及第 二损失函数, 确定第M个单路 召回模型 的损失, 所述损失表示所述第M个单路召回模型在召回对应训练数据时与所述第 一期望召回结果之间的偏差; 所述第一处 理模块, 还用于以所述损失最小为目标, 训练所述第M个单路召回模型。 8.根据权利要求7 所述的装置, 其特 征在于, 所述第一处理模块, 还用于根据各组训练数据, 第一权重, 第二权重以及代理函数, 确 定预设的神经网络模型的总损失, 其中, 预设的神经网络模型包括所述M个单路召回模型, 所述总损失表征该神经网络模型的输出数据与期 望输出数据之 间的误差, 第一权重包括M ‑ 1个, M‑1个第一权重分别为第1至第M ‑1个单路召回模 型的权重, 第二权重为第M个单路召回 模型的权 重; 所述第一处理模块, 还用于调节所述第二权重的值, 以向着所述总损失最小的方向, 对 该神经网络模型进行训练; 所述第一处理模块, 还用于将停止训练时所述总损失对应的第二权重的值, 确定为第M 个单路召回模型的目标权 重。 9.根据权利要求7或8所述的装置, 其特 征在于, 所述第一处理模块, 还用于将对所述神经网络模型每轮训练过程中的总损 失的值, 有权 利 要 求 书 2/4 页 3 CN 115374362 A 3
专利 多路召回模型训练方法、多路召回方法、装置及电子设备
文档预览
中文文档
33 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2元下载(无需注册)
温馨提示:本文档共33页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2元下载
本文档由 人生无常 于
2024-03-18 17:36:10
上传分享
举报
下载
原文档
(1.1 MB)
分享
友情链接
山东省规章和行政规范性文件备案规定.pdf
GB-T 42926-2023 金融信息系统网络安全风险评估规范.pdf
T-CEC 612—2022 港口岸电系统船用移动电源.pdf
GB-T 36072-2018 活动断层探测.pdf
JG-T118-2018 JGT118-2018建筑隔震橡胶支座.pdf
GB 18384-2020 电动汽车安全要求.pdf
GB-T 27002-2011 合格评定 保密性 原则和要求.pdf
T-GDNS 001—2020 广东省网络安全等级保护专家库管理规范.pdf
DB32-T 3740-2020 定点医药机构药品“进销存”监管工作规范 江苏省.pdf
GB 40050-2021 网络关键设备安全通用要求.pdf
GB-T 38775.6-2021 电动汽车无线充电系统 第6部分:互操作性要求及测试 地面端.pdf
T-CIIA 023—2022 科学数据 云平台运维流程与要求.pdf
DB5133-T 63-2022 牦牛标准化育肥场布局及圈舍建设规范 甘孜藏族自治州.pdf
GB-T 36716-2018 节能评估技术导则 燃煤发电项目.pdf
GB-T 36630.3-2018 信息安全技术 信息技术产品安全可控评价指标 第3部分:操作系统.pdf
企业软件安全开发实践 培训材料.pdf
TTAF 077.18—2022 APP收集使用个人信息最小必要评估规范 第18部分:剪切板信息.pdf
GB-T 38360-2019 裸露坡面植被恢复技术规范.pdf
DB34-T 1835-2022 高速公路收费人员微笑服务规范 安徽省.pdf
JFrog 中国解决方案架构师 企业级DevSecOps 开源治理方案演讲之路.pdf
1
/
3
33
评价文档
赞助2元 点击下载(1.1 MB)
回到顶部
×
微信扫码支付
2
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。