公共安全标准网
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111433251.5 (22)申请日 2021.11.29 (71)申请人 重庆邮电大 学 地址 400065 重庆市南岸区南 山街道崇文 路2号 (72)发明人 孙开伟 宣立德 冉雪 刘虎  李彦  (74)专利代理 机构 重庆市恒信知识产权代理有 限公司 5 0102 代理人 刘小红 (51)Int.Cl. G06Q 30/02(2012.01) G06Q 10/04(2012.01) G06N 3/08(2006.01) G06N 3/04(2006.01) (54)发明名称 一种基于场矩阵因子分解机改进的广告投 放方法及系统 (57)摘要 本发明请求保护一种基于场矩阵因子分解 机改进的广告投放方法。 方法为: 收集广告数据 并对所述广告数据进行预处理, 将空值或者无用 的数据进行填充或删除操作, 并将连续型特征进 行分桶处理为离散型特征, 并进行one ‑hot编码 处理, 并规划出训练集以及测试集; 将预处理后 的数据集输入到嵌入层, 所述 嵌入层是一层全 连 接神经网络, 将高维稀疏的one ‑hot特征转化为 定长的低维稠密的特征向量; 将嵌入层的输出部 分分别输入到FmFM层和DNN层进行低阶特征交叉 和高阶特征交叉, 把FmFM和DNN层的输出进行加 和并且经过sigmoid函数得到输出值, 按照输出 值进行广告投放, 利用测试集对模 型进行评估验 证。 本发明利用FmFM模型改进, 得到更加简便的 点击率预估模 型, 同时只需要更少的参数量可以 得到更好的结果。 权利要求书2页 说明书5页 附图2页 CN 114358813 A 2022.04.15 CN 114358813 A 1.一种基于场矩阵因子分解机改进的广告投放方法, 其特 征在于, 包括以下步骤: 收集广告数据并对所述广告数据进行预处理, 将空值或者无用的数据进行填充或删除 操作, 并将连续型特征进行分桶处理为离散型特征, 并进行one ‑hot编码处理, 并规划出训 练集以及测试集; 将预处理后的数据集输入到嵌入层, 所述嵌入层是一层全连接神经网络, 将高维稀疏 的one‑hot特征转化为定长的低维稠密的特 征向量; 将嵌入层的输出部分分别输入到FmFM场矩阵因子分解机层和DNN深度神经网络层进行 低阶特征交叉和高阶特征交叉, 把FmFM和DNN层的输出进行加和并且 经过sigmoid函数得到 输出值, 并且按照输出值 排序进行广告投放。 2.根据权利要求1所述的一种基于场矩阵因子分解机改进的广告投放方法, 其特征在 于, 所述数据预 处理具体包括: 使用numpy,pandas工具包进行数据的填充与删除修改, 通过 使用sklearnbao包中KBinsDiscretizer方法将连续型特征进行分桶处理成离散 型特征, 再 使用sklearn中的one ‑hotEncoder进行处理所有的特征离散型特征; 最后将数据集划分为 训练集和 测试集采用t rain_test_spl it方法。 3.根据权利要求1所述的一种基于场矩阵因子分解机改进的广告投放方法, 其特征在 于, 所述通过使用sklearnbao包中KBinsDiscretizer方法将连续型特征进行分桶处理成离 散型特征, 具体包括: KBinsDiscretizer首先对数据的范围按照一定的间隔分为若干份等长的区间, 对属于 同一个区间的数值取一个相同的值, 不同的区间则取不同的值, 因此连续型 的特征也转换 成了分类的特 征类型; 再使用sklearn中的one ‑hotEncoder进行处理所有的特征离散型特征; one ‑ hotEncoder通过将离散的特征转变为特征矩阵, 首先确 定分类变量, 其次转换为二进制向 量表示; 经 过one‑hot处理后的向量得到的是稀疏矩阵。 4.根据权利要求1 ‑3任一项所述的一种基于场矩阵因子分解机改进的广告投放方法, 其特征在于, 将得到的低维稠密向量输入到深度神经网络DNN中和浅层的特征交叉模块 FmFM中, 再将各自的预测结果 通过加和再经过sigmoid函数得到广告的点击率预测结果: 其中 代表广告点击率预估的输出结果, yFmFM代表FmFM模块的预测结果, yDNN代表DNN 模块的预测结果。 5.根据权利要求4所述的一种基于场矩阵因子分解机改进的广告投放方法, 其特征在 于, 所述FmFM模块具体包 含一个场因子分解机, 场因子分解机的公式为: 其中m代表特征域个数, w, υ分别表示分别要训练的参数和特征向量, i代表第i个特征 域, w0代表偏置权重, 表示模型的线性部分, 表示二阶特 征交叉部分, MF(i),F(j)表示特征域i和特征域j之间的交 互强度矩阵。 6.根据权利要求4所述的一种基于场矩阵因子分解机改进的广告投放方法, 其特征在权 利 要 求 书 1/2 页 2 CN 114358813 A 2于, 还包括采用测试集和评估指标对 模型的效果进行验证的步骤, 具体包括: 评估指标和l oss函数包含: AUC,二分类交叉熵损失, 所述AUC的计算方式为: 其中M,N分别是正样本个数和负样本的个数; ranki代表第i个样本的序号, 概率得分从 小到大排, 排在第ran k个位置; 二分类交叉熵损函数的计算方式为: 其中y是标签, 是预测为正的概率。 7.一种基于场矩阵因子分解机改进的广告投放系统, 其特 征在于, 包括: 预处理模块: 用于收集广告数据并对所述广告数据进行预处理, 将空值或者无用的数 据进行填充或删除操作, 并将连续型特征进行分桶处理为离散型特征, 并进行one ‑hot编码 处理, 并规划出训练集以及测试集; 嵌入模块: 所述嵌入模块是一层全连接神经网络, 用于将预处理后的数据集输入到嵌 入层, 将高维稀疏的o ne‑hot特征转化为定长的低维稠密的特 征向量; 处理模块: 用于将嵌入层的输出部分分别输入到FmFM层和DNN层进行低阶特征交叉和 高阶特征交叉, 把FmFM和DNN层的输出进行加和并且经过sigmoid函数得到输出值; 按照输 出值进行广告投放; 验证模块: 用于采用测试集和评估指标对模型的效果进行验证的步骤, 具体包括: 评估 指标和loss函数包含: AUC,二分类交叉熵损失。权 利 要 求 书 2/2 页 3 CN 114358813 A 3

.PDF文档 专利 一种基于场矩阵因子分解机改进的广告投放方法及系统

文档预览
中文文档 10 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于场矩阵因子分解机改进的广告投放方法及系统 第 1 页 专利 一种基于场矩阵因子分解机改进的广告投放方法及系统 第 2 页 专利 一种基于场矩阵因子分解机改进的广告投放方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 21:03:53上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。