(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211233877.6
(22)申请日 2022.10.10
(71)申请人 东南大学
地址 210096 江苏省南京市玄武区四牌楼 2
号
(72)发明人 胡明芮 刘波 严辉 孟青
曹玖新
(74)专利代理 机构 南京众联专利代理有限公司
32206
专利代理师 许小莉
(51)Int.Cl.
G06F 16/9535(2019.01)
G06K 9/62(2022.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
(54)发明名称
基于用户全局兴趣迁移感知的个性化新闻
推荐方法及系统
(57)摘要
本发明公开了一种基于用户全局兴趣迁移
感知的个性化新闻推荐 方法及系统, 该方法首先
从新闻数据中提取新闻标题文本和新闻标题实
体文本, 并构建用户序列、 用户和新闻之间的点
击关系网络以及新闻与新闻的顺序关系网络; 再
进行多视角关联的新闻内容表征计算; 之后计算
用户内容兴趣表征; 接着构建新闻的全局迁移
图, 卷积用户和新闻间的点击关系以及新闻与新
闻间的迁移关系, 然后融合得到的两种关系得到
用户的迁移兴趣表征; 最后, 联合用户的内容兴
趣表征和迁移兴趣表征, 构建最终的用户全局兴
趣迁移感知的新闻推荐模型, 实现个性化推荐。
系统采用web交互技术实现数据分析和推荐结果
的可视化展示。 本发明可以有效提高个性化推荐
的准确性, 鲁棒 性强。
权利要求书6页 说明书16页 附图3页
CN 115481325 A
2022.12.16
CN 115481325 A
1.一种基于用户全局兴趣迁移感知的个性化新闻推荐方法, 其特征在于, 该方法包括
以下步骤:
(1)对用户历史浏览新闻和候选新闻进行数据预处理, 构建全局的新闻与新闻的顺序
关系网络以及用户和新闻之间的点击关系网络;
(2)候选新闻 内容表征计算
使用注意力机制分别从文本视角和实体视角两个不同的视角对候选新闻进行标题文
本与实体的自注意表征计算, 并计算两个视角表征 的交叉注意表征, 结合两个视角各自的
表征和两个视角之间的交叉注意表征, 进行多视角融合计算获得候选新闻 内容表征;
(3)用户内容兴趣表征计算
使用注意力机制分别从文本视角和实体视角两个不同的视角对用户历史浏览新闻进
行标题文本与实体的自注意表征计算, 并计算两个视角表征 的交叉注意表征, 结合两个视
角各自的表征和两个视角之间的交叉注意表征, 进行多视角融合计算, 获得用户历史浏览
新闻内容表征, 然后基于注意力机制聚合用户历史浏览新闻内容表征, 得到用户内容兴趣
的表征;
(4)用户迁移兴趣表征计算
融合步骤(1)中构建的全局的新闻与新闻的顺序关系网络以及用户和新闻之间的点击
关系网络, 构建全局 新闻迁移图, 将全局 新闻迁移图中用户节点表征和 不同的邻居新闻节
点表征作为输入, 使用两层迁移感知的图注意网络来进行信息聚合和学习, 最后得到用户
迁移兴趣表征、 新闻表征、 迁移 表征, 所述迁移 表征包括传播表征和影响表征;
(5)联合推荐模型
结合步骤(2)得到的候选新 闻内容表征、 步骤(3)得到的用户内容兴趣表征、 步骤(4)得
到的用户迁移兴趣表征、 新闻表征、 迁移表征, 构建联合推荐模块并进行新闻推荐, 对步骤
(3)得到的用户内容兴趣表征与步骤(2)得到的候选新闻内容表征进 行相似度计算, 得到用
户内容兴趣评分, 对用户迁移兴趣表征与候选新闻表征、 迁移表征进行相似度计算得到用
户迁移兴趣评分; 将用户内容兴趣评分和用户迁移兴趣评分进行加权求和, 得到最终用户
对候选新闻的交互概率, 最后依据交互概率的排序返回候选新闻集合中推荐的top ‑k新闻
列表;
(6)系统功能展示。
2.根据权利要求1所述的基于用户全局兴趣迁移感知的个性化新闻推荐方法, 其特征
在于, 步骤(1)的具体方法是, 从用户历史浏览新闻和候选新闻中提取新闻标题文本字段以
及标题实体字段, 分别通过Glove词向量和维基百科上训练的实体 向量获取对应的新闻标
题词向量和实体向量作为初始向量表示; 按照用户浏览新闻的时间顺序构建每个用户历史
浏览新闻序列, 同时构建用户和历史浏览新闻之间的点击关系网络, 然后根据用户的历史
浏览新闻的序列数据, 将点击前后的历史浏览新闻之间连边, 构建全局的新闻与新闻的顺
序关系网络 。
3.根据权利要求1所述的基于用户全局兴趣迁移感知的个性化新闻推荐方法, 其特征
在于, 步骤(2)包括如下 具体步骤:
(2‑1)对于给定候选新闻ni, 新闻的标题文本序列表示为
其权 利 要 求 书 1/6 页
2
CN 115481325 A
2中Ti表示第i条新闻的标题 文本, wi,j即为第i条新闻的标题文本中的第j个单词, |Ti|为标题
文本中单词的总数; 新闻的实体序列表示为
其中Ei表示第i条新
闻的标题实体, ei,j即为第i条新闻的标题中的第j个实体, |Ei|即为标题中实体的总数; 利
用自注意力学习新闻的标题文本序列表征矩阵
其计算过
程如下:
其中,
为单词序列的词向量矩阵, 上标T表示矩阵转置操作, dw是单词的特征维
度,
表示单词wi,j的向量表示,
表示新闻ni中第j个单词的自注意力影响
权重, exp( ·)表示以自然常数e为底的指数函数,
是新闻ni中第j个单词的自注意力表
征权重, k是指第k个单词,
是单词的自注意力表征, 将每个单词依据归一化权
重向量进行更新得到文本序列表征矩阵
之后, 利用自注意力机制计算第i条新闻标题
文本自注意表示
对于标题中的实体也进行自注意力学习实体序列表示, 得到新闻标题的实体序列表征
矩阵
其中
表示第i个新闻的标题中的第j个实体的自注意力
表征, 以及得到新闻标题中的实体自注意表示
(2‑2)通过对新闻的标题文本序列表征矩阵
和新闻的实体序列表示
进行交叉注
意得到单词与实体两两之 间的关联程度, 分别加和行、 列作为单词和实体的权重值, 再通过
加权分别聚合文本集 合和实体集合特征得到文本层面交叉学习表示
和实体层面交叉
学习表示
的具体计算过程如下:
其中
表示单词wi,j的自注意向量表示,
表示实体ei,k的自注意向量表权 利 要 求 书 2/6 页
3
CN 115481325 A
3
专利 基于用户全局兴趣迁移感知的个性化新闻推荐方法及系统
文档预览
中文文档
26 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共26页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 00:14:06上传分享