(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210906295.3
(22)申请日 2022.07.29
(71)申请人 平安科技 (深圳) 有限公司
地址 518000 广东省深圳市福田区福田街
道福安社区益田路5033号平 安金融中
心23楼
(72)发明人 王健宗 李泽远 司世景
(74)专利代理 机构 广州嘉权专利商标事务所有
限公司 4 4205
专利代理师 梁国平
(51)Int.Cl.
G06Q 30/06(2012.01)
G06F 16/33(2019.01)
G06F 40/30(2020.01)
(54)发明名称
物品推荐模型训练方法、 物品推荐方法、 装
置及存储介质
(57)摘要
本申请实施例提供了一种物品推荐模型训
练方法、 物品推荐方法、 装置及存储介质, 属于人
工智能技术领域。 该方法包括: 获取多个历史用
户信息、 历史物品信息、 历史物品信息的历史评
论信息、 真实物品标签和真实评分标签, 并输入
预设的预测模型, 得到历史用户嵌入向量、 历史
物品嵌入向量和历史评论 嵌入向量, 进而确定逐
点损失函数; 根据历史用户嵌入向量和历史评论
嵌入向量确定预测评分信息, 并根据预测评分信
息和真实评分标签, 确定成对损失函数; 基于逐
点损失函数和成对损失函数, 对 预测模型进行训
练, 得到物品推荐模型。 本申请实施例能够使物
品推荐模型避免受到评论信息的语义偏差的影
响, 保证预测评分信息的准确性, 进而提高物品
推荐的准确度。
权利要求书3页 说明书12页 附图6页
CN 115222486 A
2022.10.21
CN 115222486 A
1.一种物品推荐模型训练方法, 其特 征在于, 所述方法包括:
获取多个历史用户信 息、 历史物品信 息、 所述历史物品信 息的历史评论信息、 真实物品
标签和真实评 分标签, 其中, 所述历史评论信息与所述历史用户信息匹配, 所述真实物品标
签与所述历史物品信息匹配, 所述真实评分标签与所述历史评论信息匹配;
将所述历史用户信 息、 任意两个所述历史物品信 息和任意两个所述历史物品信 息的历
史评论信息输入预设的预测模型, 得到历史用户嵌入向量、 历史物品嵌入向量和历史评论
嵌入向量;
根据所述历史用户嵌入向量、 所述历史物品嵌入向量和所述真实物品标签, 确定逐点
损失函数;
根据所述历史用户嵌入向量和所述历史评论嵌入向量确定预测评分信 息, 并根据 所述
预测评分信息和所述真实评分标签, 确定成对损失函数;
基于所述逐点损 失函数和所述成对损 失函数, 对所述预测模型进行训练, 得到物品推
荐模型。
2.根据权利要求1所述的方法, 其特征在于, 所述预测模型包括用户网络、 物品网络、 评
论原始网络和评论动量网络, 其中, 所述评论动量网络与所述评论原始网络的网络结构相
同。
3.根据权利要求2所述的方法, 其特征在于, 所述历史评论嵌入向量包括第 一历史评论
对嵌入向量和第二历史评论对嵌入向量;
所述将所述历史用户信 息、 任意两个所述历史物品信 息和任意两个所述历史物品信 息
的历史评论信息输入预设的预测模型, 得到历史用户嵌入向量、 历史物品嵌入向量和历史
评论嵌入向量, 包括:
将所述历史用户信息 输入所述用户网络, 得到历史用户嵌入向量;
将任意两个所述历史物品信息 输入所述物品 网络, 得到 两个历史物品嵌入向量;
将任意两个所述历史物品信 息的历史评论信 息输入所述评论原始网络, 得到所述第 一
历史评论对嵌入向量;
将任意两个所述历史物品信 息的历史评论信 息输入所述评论动量网络, 得到所述第 二
历史评论对嵌入向量。
4.根据权利要求3所述的方法, 其特征在于, 所述基于所述逐点损失函数和所述成对损
失函数, 对所述预测模型进行训练, 得到物品推荐模型, 包括:
根据所述逐点损失函数和所述成对损失函数, 确定模型总损失函数;
根据所述模型总损 失函数, 更新所述历史用户网络、 所述物品网络和所述评论原始网
络的模型参数;
根据更新后的所述评论原 始网络和预设的动量更新系数, 确定动量更新 函数;
根据所述动量更新 函数, 更新所述评论动量网络的模型参数, 以得到物品推荐模型。
5.根据权利要求 4所述的方法, 其特 征在于, 所述逐点损失函数的公式为:
其中, L1为所述逐点损失函数, yij为第i个所述历史用户信息与第j个所述历史物品信
息对应的所述真 实物品标签, pij为第i个所述历史用户信息与第j个所述历史物品信息对 应权 利 要 求 书 1/3 页
2
CN 115222486 A
2的预测物品信息, n 为所有所述历史物品信息的数量;
pij=ui·vj,
其中, ui为第i个所述历史用户信息对应的历史用户嵌入向量, vj为第j个所述历史物品
信息对应的历史物品嵌入向量;
所述成对损失函数的公式为:
其中, L2为所述成对损失函数, yis为第i个所述历史用户信息与第s个所述历史评论信
息对应的所述真 实评分标签, yit为第i个所述历史用户信息与第t个所述历史评 论信息对 应
的所述真实评分标签, rs′为第s个所述历史评论信息对应的所述第二历史评论对嵌入向
量, rt′为第t个所述历史评论信息对应的所述第二历史评论对嵌入向量, m为所有所述历史
用户信息的数量, n为所有所述历史评论信息的数量; 当yis<yit, I(yis<yit)=1, 否则I(yis
<yit)=0; max(0,ui·rs′ ‑ui·rt′)用于确定 0和ui·rs′ ‑ui·rt′中的最大值;
所述模型总损失函数的公式为:
Ltotal=L1+λ1L2+λ2Lreg,
其中, Ltotal为所述模型总损失函数, λ1和 λ2为预设的超参数, Lreg为正则化项;
所述正则化项的公式为:
其中, Θk为所述预测模型中的第k个模型参数, K为所述预测模型中的所有模型参数的
数量。
6.根据权利要求 4所述的方法, 其特 征在于, 所述动量更新 函数的公式为:
wm= δ wm′+(1‑δ )wv,
其中, wm为所述评论动量网络的模型参数, δ为所述动量更新系数, wm′为更新前的所述
评论动量网络的模型参数, wv为更新后的所述评论原 始网络的模型参数。
7.一种物品推荐方法, 其特 征在于, 所述方法包括:
获取目标用户信息、 多个目标物品信息和所述目标物品信息的目标评论信息, 并将所
述目标用户信息、 所述 目标物品信息和所述 目标评论信息输入物品推荐模型, 得到各个目
标物品信息的预测评分信息, 其中, 所述物品推荐模型由权利要求1至6中任一项所述的物
品推荐模型训练方法训练得到;
基于所述预测评分信息, 在多个所述目标物品信息中确定物品推荐信息 。
8.一种物品推荐模型训练装置, 其特 征在于, 所述装置包括:
获取单元, 用于获取多个历史用户信 息、 历史物品信息、 所述历史物品信息的历史评论
信息、 真实物品标签和真实评分标签, 其中, 所述历史评论信息与所述历史用户信息匹配,
所述真实物品标签与所述历史物品信息匹配, 所述真实评分标签与所述历史评论信息匹
配;
输入单元, 用于将所述历史用户信息、 任意两个所述历史物品信息和任意两个所述历
史物品信息的历史评论信息输入预设的预测模型, 得到历史用户嵌入向量、 历史物品嵌入
向量和历史评论嵌入向量;
第一确定单元, 用于根据所述历史用户嵌入向量、 所述历史物品嵌入向量和所述真实权 利 要 求 书 2/3 页
3
CN 115222486 A
3
专利 物品推荐模型训练方法、物品推荐方法、装置及存储介质
文档预览
中文文档
22 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共22页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-03-03 12:14:23上传分享