专利 物品推荐模型训练方法、物品推荐方法、装置及存储介质

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210906295.3 (22)申请日 2022.07.29 (71)申请人平安科技（深圳）有限公司地址 518000 广东省深圳市福田区福田街道福安社区益田路5033号平安金融中心23楼 (72)发明人王健宗　李泽远　司世景　 (74)专利代理机构广州嘉权专利商标事务所有限公司 4 4205 专利代理师梁国平 (51)Int.Cl. G06Q 30/06(2012.01) G06F 16/33(2019.01) G06F 40/30(2020.01) (54)发明名称物品推荐模型训练方法、物品推荐方法、装置及存储介质 (57)摘要本申请实施例提供了一种物品推荐模型训练方法、物品推荐方法、装置及存储介质，属于人工智能技术领域。该方法包括：获取多个历史用户信息、历史物品信息、历史物品信息的历史评论信息、真实物品标签和真实评分标签，并输入预设的预测模型，得到历史用户嵌入向量、历史物品嵌入向量和历史评论嵌入向量，进而确定逐点损失函数；根据历史用户嵌入向量和历史评论嵌入向量确定预测评分信息，并根据预测评分信息和真实评分标签，确定成对损失函数；基于逐点损失函数和成对损失函数，对预测模型进行训练，得到物品推荐模型。本申请实施例能够使物品推荐模型避免受到评论信息的语义偏差的影响，保证预测评分信息的准确性，进而提高物品推荐的准确度。权利要求书3页说明书12页附图6页 CN 115222486 A 2022.10.21 CN 115222486 A 1.一种物品推荐模型训练方法，其特征在于，所述方法包括：获取多个历史用户信息、历史物品信息、所述历史物品信息的历史评论信息、真实物品标签和真实评分标签，其中，所述历史评论信息与所述历史用户信息匹配，所述真实物品标签与所述历史物品信息匹配，所述真实评分标签与所述历史评论信息匹配；将所述历史用户信息、任意两个所述历史物品信息和任意两个所述历史物品信息的历史评论信息输入预设的预测模型，得到历史用户嵌入向量、历史物品嵌入向量和历史评论嵌入向量；根据所述历史用户嵌入向量、所述历史物品嵌入向量和所述真实物品标签，确定逐点损失函数；根据所述历史用户嵌入向量和所述历史评论嵌入向量确定预测评分信息，并根据所述预测评分信息和所述真实评分标签，确定成对损失函数；基于所述逐点损失函数和所述成对损失函数，对所述预测模型进行训练，得到物品推荐模型。 2.根据权利要求1所述的方法，其特征在于，所述预测模型包括用户网络、物品网络、评论原始网络和评论动量网络，其中，所述评论动量网络与所述评论原始网络的网络结构相同。 3.根据权利要求2所述的方法，其特征在于，所述历史评论嵌入向量包括第一历史评论对嵌入向量和第二历史评论对嵌入向量；所述将所述历史用户信息、任意两个所述历史物品信息和任意两个所述历史物品信息的历史评论信息输入预设的预测模型，得到历史用户嵌入向量、历史物品嵌入向量和历史评论嵌入向量，包括：将所述历史用户信息输入所述用户网络，得到历史用户嵌入向量；将任意两个所述历史物品信息输入所述物品网络，得到两个历史物品嵌入向量；将任意两个所述历史物品信息的历史评论信息输入所述评论原始网络，得到所述第一历史评论对嵌入向量；将任意两个所述历史物品信息的历史评论信息输入所述评论动量网络，得到所述第二历史评论对嵌入向量。 4.根据权利要求3所述的方法，其特征在于，所述基于所述逐点损失函数和所述成对损失函数，对所述预测模型进行训练，得到物品推荐模型，包括：根据所述逐点损失函数和所述成对损失函数，确定模型总损失函数；根据所述模型总损失函数，更新所述历史用户网络、所述物品网络和所述评论原始网络的模型参数；根据更新后的所述评论原始网络和预设的动量更新系数，确定动量更新函数；根据所述动量更新函数，更新所述评论动量网络的模型参数，以得到物品推荐模型。 5.根据权利要求 4所述的方法，其特征在于，所述逐点损失函数的公式为：其中， L1为所述逐点损失函数， yij为第i个所述历史用户信息与第j个所述历史物品信息对应的所述真实物品标签， pij为第i个所述历史用户信息与第j个所述历史物品信息对应权　利　要　求　书 1/3 页 2 CN 115222486 A 2的预测物品信息， n 为所有所述历史物品信息的数量； pij＝ui·vj，其中， ui为第i个所述历史用户信息对应的历史用户嵌入向量， vj为第j个所述历史物品信息对应的历史物品嵌入向量；所述成对损失函数的公式为：其中， L2为所述成对损失函数， yis为第i个所述历史用户信息与第s个所述历史评论信息对应的所述真实评分标签， yit为第i个所述历史用户信息与第t个所述历史评论信息对应的所述真实评分标签， rs′为第s个所述历史评论信息对应的所述第二历史评论对嵌入向量， rt′为第t个所述历史评论信息对应的所述第二历史评论对嵌入向量， m为所有所述历史用户信息的数量， n为所有所述历史评论信息的数量；当yis＜yit， I(yis＜yit)＝1，否则I(yis ＜yit)＝0； max(0,ui·rs′ ‑ui·rt′)用于确定 0和ui·rs′ ‑ui·rt′中的最大值；所述模型总损失函数的公式为： Ltotal＝L1+λ1L2+λ2Lreg，其中， Ltotal为所述模型总损失函数， λ1和 λ2为预设的超参数， Lreg为正则化项；所述正则化项的公式为：其中， Θk为所述预测模型中的第k个模型参数， K为所述预测模型中的所有模型参数的数量。 6.根据权利要求 4所述的方法，其特征在于，所述动量更新函数的公式为： wm＝ δ wm′+(1‑δ )wv，其中， wm为所述评论动量网络的模型参数， δ为所述动量更新系数， wm′为更新前的所述评论动量网络的模型参数， wv为更新后的所述评论原始网络的模型参数。 7.一种物品推荐方法，其特征在于，所述方法包括：获取目标用户信息、多个目标物品信息和所述目标物品信息的目标评论信息，并将所述目标用户信息、所述目标物品信息和所述目标评论信息输入物品推荐模型，得到各个目标物品信息的预测评分信息，其中，所述物品推荐模型由权利要求1至6中任一项所述的物品推荐模型训练方法训练得到；基于所述预测评分信息，在多个所述目标物品信息中确定物品推荐信息。 8.一种物品推荐模型训练装置，其特征在于，所述装置包括：获取单元，用于获取多个历史用户信息、历史物品信息、所述历史物品信息的历史评论信息、真实物品标签和真实评分标签，其中，所述历史评论信息与所述历史用户信息匹配，所述真实物品标签与所述历史物品信息匹配，所述真实评分标签与所述历史评论信息匹配；输入单元，用于将所述历史用户信息、任意两个所述历史物品信息和任意两个所述历史物品信息的历史评论信息输入预设的预测模型，得到历史用户嵌入向量、历史物品嵌入向量和历史评论嵌入向量；第一确定单元，用于根据所述历史用户嵌入向量、所述历史物品嵌入向量和所述真实权　利　要　求　书 2/3 页 3 CN 115222486 A 3

专利 物品推荐模型训练方法、物品推荐方法、装置及存储介质

专利物品推荐模型训练方法、物品推荐方法、装置及存储介质