(19)中华 人民共和国 国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202111433251.5
(22)申请日 2021.11.29
(71)申请人 重庆邮电大 学
地址 400065 重庆市南岸区南 山街道崇文
路2号
(72)发明人 孙开伟 宣立德 冉雪 刘虎
李彦
(74)专利代理 机构 重庆市恒信知识产权代理有
限公司 5 0102
代理人 刘小红
(51)Int.Cl.
G06Q 30/02(2012.01)
G06Q 10/04(2012.01)
G06N 3/08(2006.01)
G06N 3/04(2006.01)
(54)发明名称
一种基于场矩阵因子分解机改进的广告投
放方法及系统
(57)摘要
本发明请求保护一种基于场矩阵因子分解
机改进的广告投放方法。 方法为: 收集广告数据
并对所述广告数据进行预处理, 将空值或者无用
的数据进行填充或删除操作, 并将连续型特征进
行分桶处理为离散型特征, 并进行one ‑hot编码
处理, 并规划出训练集以及测试集; 将预处理后
的数据集输入到嵌入层, 所述 嵌入层是一层全 连
接神经网络, 将高维稀疏的one ‑hot特征转化为
定长的低维稠密的特征向量; 将嵌入层的输出部
分分别输入到FmFM层和DNN层进行低阶特征交叉
和高阶特征交叉, 把FmFM和DNN层的输出进行加
和并且经过sigmoid函数得到输出值, 按照输出
值进行广告投放, 利用测试集对模 型进行评估验
证。 本发明利用FmFM模型改进, 得到更加简便的
点击率预估模 型, 同时只需要更少的参数量可以
得到更好的结果。
权利要求书2页 说明书5页 附图2页
CN 114358813 A
2022.04.15
CN 114358813 A
1.一种基于场矩阵因子分解机改进的广告投放方法, 其特 征在于, 包括以下步骤:
收集广告数据并对所述广告数据进行预处理, 将空值或者无用的数据进行填充或删除
操作, 并将连续型特征进行分桶处理为离散型特征, 并进行one ‑hot编码处理, 并规划出训
练集以及测试集;
将预处理后的数据集输入到嵌入层, 所述嵌入层是一层全连接神经网络, 将高维稀疏
的one‑hot特征转化为定长的低维稠密的特 征向量;
将嵌入层的输出部分分别输入到FmFM场矩阵因子分解机层和DNN深度神经网络层进行
低阶特征交叉和高阶特征交叉, 把FmFM和DNN层的输出进行加和并且 经过sigmoid函数得到
输出值, 并且按照输出值 排序进行广告投放。
2.根据权利要求1所述的一种基于场矩阵因子分解机改进的广告投放方法, 其特征在
于, 所述数据预 处理具体包括: 使用numpy,pandas工具包进行数据的填充与删除修改, 通过
使用sklearnbao包中KBinsDiscretizer方法将连续型特征进行分桶处理成离散 型特征, 再
使用sklearn中的one ‑hotEncoder进行处理所有的特征离散型特征; 最后将数据集划分为
训练集和 测试集采用t rain_test_spl it方法。
3.根据权利要求1所述的一种基于场矩阵因子分解机改进的广告投放方法, 其特征在
于, 所述通过使用sklearnbao包中KBinsDiscretizer方法将连续型特征进行分桶处理成离
散型特征, 具体包括:
KBinsDiscretizer首先对数据的范围按照一定的间隔分为若干份等长的区间, 对属于
同一个区间的数值取一个相同的值, 不同的区间则取不同的值, 因此连续型 的特征也转换
成了分类的特 征类型;
再使用sklearn中的one ‑hotEncoder进行处理所有的特征离散型特征; one ‑
hotEncoder通过将离散的特征转变为特征矩阵, 首先确 定分类变量, 其次转换为二进制向
量表示; 经 过one‑hot处理后的向量得到的是稀疏矩阵。
4.根据权利要求1 ‑3任一项所述的一种基于场矩阵因子分解机改进的广告投放方法,
其特征在于, 将得到的低维稠密向量输入到深度神经网络DNN中和浅层的特征交叉模块
FmFM中, 再将各自的预测结果 通过加和再经过sigmoid函数得到广告的点击率预测结果:
其中
代表广告点击率预估的输出结果, yFmFM代表FmFM模块的预测结果, yDNN代表DNN
模块的预测结果。
5.根据权利要求4所述的一种基于场矩阵因子分解机改进的广告投放方法, 其特征在
于, 所述FmFM模块具体包 含一个场因子分解机, 场因子分解机的公式为:
其中m代表特征域个数, w, υ分别表示分别要训练的参数和特征向量, i代表第i个特征
域, w0代表偏置权重,
表示模型的线性部分,
表示二阶特
征交叉部分, MF(i),F(j)表示特征域i和特征域j之间的交 互强度矩阵。
6.根据权利要求4所述的一种基于场矩阵因子分解机改进的广告投放方法, 其特征在权 利 要 求 书 1/2 页
2
CN 114358813 A
2于, 还包括采用测试集和评估指标对 模型的效果进行验证的步骤, 具体包括:
评估指标和l oss函数包含: AUC,二分类交叉熵损失, 所述AUC的计算方式为:
其中M,N分别是正样本个数和负样本的个数; ranki代表第i个样本的序号, 概率得分从
小到大排, 排在第ran k个位置;
二分类交叉熵损函数的计算方式为:
其中y是标签,
是预测为正的概率。
7.一种基于场矩阵因子分解机改进的广告投放系统, 其特 征在于, 包括:
预处理模块: 用于收集广告数据并对所述广告数据进行预处理, 将空值或者无用的数
据进行填充或删除操作, 并将连续型特征进行分桶处理为离散型特征, 并进行one ‑hot编码
处理, 并规划出训练集以及测试集;
嵌入模块: 所述嵌入模块是一层全连接神经网络, 用于将预处理后的数据集输入到嵌
入层, 将高维稀疏的o ne‑hot特征转化为定长的低维稠密的特 征向量;
处理模块: 用于将嵌入层的输出部分分别输入到FmFM层和DNN层进行低阶特征交叉和
高阶特征交叉, 把FmFM和DNN层的输出进行加和并且经过sigmoid函数得到输出值; 按照输
出值进行广告投放;
验证模块: 用于采用测试集和评估指标对模型的效果进行验证的步骤, 具体包括: 评估
指标和loss函数包含: AUC,二分类交叉熵损失。权 利 要 求 书 2/2 页
3
CN 114358813 A
3
专利 一种基于场矩阵因子分解机改进的广告投放方法及系统
文档预览
中文文档
10 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 21:03:53上传分享