公共安全标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111625468.6 (22)申请日 2021.12.28 (71)申请人 天翼数字生活科技有限公司 地址 200072 上海市 静安区万 荣路1256、 1258号1423室 (72)发明人 袁凯 王霄雨 戴世诚 袁晨晖  傅雨婷 沈鹏  (74)专利代理 机构 上海专利商标事务所有限公 司 31100 专利代理师 蔡悦 杨洁 (51)Int.Cl. G06K 9/62(2022.01) (54)发明名称 一种IPTV用户分类预测方法和系统 (57)摘要 本发明提供了一种IPTV用户分类预测方法 和系统。 方法包括: 获取原始数据, 所述原始数据 至少包括用户信息以及用户行为数据; 对所述原 始数据进行数据预处理, 得到特征数据集; 对所 述特征数据集进行分析以确定多个用户分类标 签; 以及为特征数据集添加所述用户分类标签作 为训练数据来进行模型训练, 其中模 型训练包括 训练多个单分类器, 并基于每一个单分类器的预 测效果确定分类器组合作为经训练的所述IPTV 用户分类模型。 在预测时, 将特征数据输入IPTV 用户分类模 型, 通过分类器组合中所包括的多个 单分类器分别进行用户分类标签预测; 以及基于 每一个单分类器的预测结果通过投票机制确定 输出的预测用户分类标签 。 权利要求书2页 说明书8页 附图3页 CN 114925738 A 2022.08.19 CN 114925738 A 1.一种用于训练IPTV用户分类模型的方法, 其特 征在于, 所述方法包括: 获取原始数据, 所述原 始数据至少包括用户信息以及用户行为数据; 对所述原 始数据进行 数据预处 理, 得到特 征数据集; 对所述特 征数据集进行分析以确定多个用户分类标签; 以及 为特征数据集添加所述用户分类标签作为训练数据来进行模型训练, 其中模型训练包 括训练多个单分类器, 并基于每一个单分类器的预测效果确定 分类器组合作为经训练的所 述IPTV用户分类模型。 2.如权利要求1所述的方法, 其特征在于, 对所述原始数据进行数据预处理进一步包 括: 从原始数据中抽取 特征数据; 对抽取的特 征数据进行清洗; 以及 基于用户id进行关联, 形成特 征数据集。 3.如权利要求2所述的方法, 其特征在于, 对所述原始数据进行数据预处理进一步包 括: 为特征数据添加用户偏好标签, 其中所述用户偏好标签是基于分时段标签模型、 使用 牛顿冷却定律建立的用户画像模型中的标签。 4.如权利要求3所述的方法, 其特征在于, 在所述用户画像模型中, 同一维度的标签值 随时间衰减, 使得时间越久的用户历史行为对于确定的用户偏好标签的影响越少。 5.如权利要求1所述的方法, 其特征在于, 模型训练进一步包括针对不同场景分别进行 模型训练。 6.如权利要求1所述的方法, 其特征在于, 基于每一个单分类器的预测效果确定分类器 组合作为经训练的所述 IPTV用户分类模型进一 步包括: 选择预测准确率 最高的若干个单分类 器作为分类 器组合; 以及 保存所述分类 器组合结果作为所述 IPTV用户分类模型的分类 器库文件。 7.一种用于预测IPTV用户分类的方法, 其特 征在于, 所述方法包括: 获取待预测原 始数据, 所述待预测原 始数据至少包括用户信息以及用户行为数据; 对所述待预测原 始数据进行 数据预处 理, 得到待预测特 征数据; 以及 将所述待预测特征数据输入根据权利要求1-6中任意一项所述的方法训练而成的 IPTV用户分类模型, 得到预测用户分类标签, 其中得到预测的用户分类标签进一 步包括: 通过分类 器组合中所包括的多个单分类 器分别进行用户分类标签预测; 以及 基于每一个单分类 器的预测结果 通过投票机制确定 输出的预测用户分类标签。 8.一种用于预测IPTV用户分类的系统, 其特 征在于, 所述系统包括: 数据预处 理模块, 所述数据预处 理模块被 配置成: 获取原始数据, 所述原 始数据至少包括用户信息以及用户行为数据; 对所述原 始数据进行 数据预处 理, 得到特 征数据集; 以及 对所述用户行为数据进行分析以确定多个用户分类标签; 以及 模型训练模块, 所述模型训练模块被 配置成: 为特征数据集添加所述用户分类标签作为训练数据来进行模型训练, 其中模型训练包权 利 要 求 书 1/2 页 2 CN 114925738 A 2括训练多个单分类器, 并基于每一个单分类器的预测效果确定 分类器组合作为经训练的所 述IPTV用户分类模型。 9.如权利要求8所述的系统, 其特 征在于, 所述数据预处 理模块被进一 步配置成: 获取待预测原始数据, 所述待预测原始数据至少包括用户信息以及用户行为数据; 以 及 对所述待预测原 始数据进行 数据预处 理, 得到待预测特 征数据, 所述系统进一 步包括用户分类预测模块, 所述用户分类预测模块被 配置成: 将所述待预测特征数据输入根据权利要求1-6中任意一项所述的方法训练而成的 IPTV用户分类模型, 得到预测用户分类标签, 其中得到预测的用户分类标签进一 步包括: 通过分类 器组合中所包括的多个单分类 器分别进行用户分类标签预测; 以及 基于每一个单分类 器的预测结果 通过投票机制来确定 输出的预测用户分类标签。 10.如权利要求8所述的系统, 其特征在于, 所述模型训练模块被进一步配置成针对不 同场景分别进行模型训练, 并且保存针对每一个不同场景的分类 器组合, 并且 所述用户分类预测模块被进一步配置成: 针对当前场景加载相应的分类器组合, 并使 用加载的分类 器组合来预测用户分类标签。权 利 要 求 书 2/2 页 3 CN 114925738 A 3

.PDF文档 专利 一种IPTV用户分类预测方法和系统

文档预览
中文文档 14 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种IPTV用户分类预测方法和系统 第 1 页 专利 一种IPTV用户分类预测方法和系统 第 2 页 专利 一种IPTV用户分类预测方法和系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-19 00:17:50上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。