(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210760241.0
(22)申请日 2022.06.30
(71)申请人 上海哔哩哔哩科技有限公司
地址 200433 上海市杨 浦区四平路1945号
1641室
(72)发明人 赵卓男 陆志君
(74)专利代理 机构 北京智信禾专利代理有限公
司 11637
专利代理师 李琪
(51)Int.Cl.
G06F 3/06(2006.01)
G06F 16/2458(2019.01)
G06F 16/2455(2019.01)
(54)发明名称
数据处理方法及装置
(57)摘要
本申请提供数据处理方法及装置, 其中所述
数据处理方法包括: 获取针对目标对象在预设历
史时间区间内的用户行为明细数据; 确定所述用
户行为明细数据中的用户属性信息和事件属性
信息; 根据所述用户行为明细数据中的用户标识
对所述用户属性信息和所述事件属性信息进行
聚合, 获得聚合数据, 其中, 所述聚合数据包括用
户属性信息和事件统计结果; 基于目标数据压缩
结构对所述聚合数据进行格式转换, 获得所述目
标对象的用户事件数据。 通过对用户行为明细数
据中的用户属性信息和事件属性信息进行聚合,
并将聚合数据转换为用户事件数据, 缩小用户行
为明细数据占据的存储空间, 进而提升了存储效
率。
权利要求书3页 说明书15页 附图6页
CN 115048059 A
2022.09.13
CN 115048059 A
1.一种数据处 理方法, 其特 征在于, 包括:
获取针对目标对象在预设历史时间区间内的用户行为明细数据;
确定所述用户行为明细数据中的用户属性信息和事 件属性信息;
根据所述用户行为明细数据中的用户标识对所述用户属性信息和所述事件属性信息
进行聚合, 获得聚合数据, 其中, 所述聚合数据包括用户属性信息和事 件统计结果;
基于目标数据压缩结构对所述 聚合数据进行格式转换, 获得所述目标对象的用户事件
数据。
2.如权利要求1所述的方法, 其特征在于, 根据所述用户行为明细数据中的用户标识对
所述用户属性信息和所述事 件属性信息进行聚合, 获得聚合数据, 包括:
在所述用户行为明细数据中确定目标用户标识;
根据所述目标用户标识在所述用户行为明细数据中确定用户行为子数据;
对所述用户行为子数据中的用户属性信 息执行去重处理, 获得所述目标用户标识对应
的用户属性信息;
根据所述目标用户标识对应的用户属性信息对所述用户行为子数据中的事件属性信
息执行聚合处 理, 获得所述用户属性信息对应的聚合数据。
3.如权利要求2所述的方法, 其特征在于, 根据所述目标用户标识对应的用户属性信 息
对所述用户行为子数据中的事件属性信息执行聚合处理, 获得所述用户属性信息对应的聚
合数据, 包括:
在所述用户行为子数据中确定所述用户属性信息对应的目标用户行为子数据;
根据所述事件属性信 息统计所述目标用户行为子数据中每个事件的执行次数, 获得事
件统计结果, 其中, 所述事 件统计结果包括事 件类型和事 件类型对应的执 行次数;
拼接所述用户属性信息和所述事件统计结果, 获得所述用户属性信息对应的聚合数
据。
4.如权利要求1所述的方法, 其特征在于, 确定所述用户行为明细数据中的用户属性信
息和事件属性信息, 包括:
确定所述用户行为明细数据中与用户标识对应的信息为用户属性信息;
确定所述用户行为明细数据中与事 件类型对应的信息为事 件属性信息 。
5.如权利要求1所述的方法, 其特征在于, 基于目标数据压缩结构对所述 聚合数据进行
格式转换, 获得 所述目标对象的用户路径数据, 包括:
基于目标数据压缩结构将所述 聚合数据的用户属性信 息中的用户标识进行格式转换,
获得所述目标对象的用户事 件数据。
6.如权利要求1所述的方法, 其特征在于, 基于目标数据压缩结构对所述 聚合数据进行
格式转换, 获得 所述目标对象的用户路径数据之后, 还 包括:
获取针对目标对象的用户标识以及所述用户标识对应的属性标签;
基于目标数据压缩结构对所述用户标识进行格式转换, 基于转换后的用户标识以及所
述属性标签, 确定所述目标对象的用户标签数据。
7.如权利要求6所述的方法, 其特征在于, 基于目标数据压缩结构对所述 聚合数据进行
格式转换, 获得 所述目标对象的用户事 件数据之后, 还 包括:
将所述目标对象的用户事 件数据存 储至数据库;权 利 要 求 书 1/3 页
2
CN 115048059 A
2相应地, 所述基于转换后的用户标识以及所述属性标签, 确定所述目标对象的用户标
签数据之后, 还 包括:
将所述目标对象的用户标签数据存 储至数据库。
8.根据权利要求7所述的方法, 其特征在于, 将所述目标对象的用户事件数据存储至数
据库之后, 还 包括:
接收针对目标对象的用户事件数据查询请求, 其中, 所述用户事件数据查询请求中携
带有基础配置查询条件;
基于所述基础配置查询条件在所述数据库中的用户事件数据中, 查询对应的用户事件
数据, 其中, 所述基础配置查询条件包括事件时间条件、 埋点事件条件、 用户设备条件的至
少一项;
基于所述用户事件数据生成用户事件统计图, 并将所述用户事件统计图发送至所述目
标对象的用户事 件统计图展示界面。
9.根据权利要求7所述的方法, 其特征在于, 将所述目标对象的用户标签数据存储至数
据库之后, 还 包括:
接收针对目标对象的用户事件数据查询请求, 其中, 所述用户事件数据查询请求携带
有基础配置查询条件以及标签数据查询条件;
基于所述基础配置查询条件从数据库的用户事件数据中, 确定待处理用户事件数据,
以及基于所述标签数据查询条件从数据库的用户标签数据中, 确定待处 理用户标签数据;
根据预设数据处理方式, 对所述待处理用户事件数据以及所述待处理用户标签数据进
行处理, 获得标签用户事 件数据;
基于所述标签用户事件数据生成标签用户事件统计图, 并将所述标签用户事件统计图
发送至所述目标对象的用户事 件统计图展示界面。
10.根据权利要求9所述的方法, 其特征在于, 根据 预设数据处理方式, 对所述待处理用
户事件数据以及所述待处 理用户标签数据进行处 理, 获得标签用户事 件数据, 包括:
确定所述基础配置查询条件以及所述标签数据查询条件之间的关联关系, 基于所述关
联关系确定预设数据处 理方式;
基于所述预设数据处理方式对所述待处理用户事件数据以及所述待处理用户标签数
据进行处 理, 获得标签用户事 件数据。
11.如权利要求1所述的方法, 其特征在于, 所述用户属性信 息包括用户设备信 息、 用户
标识信息和用户等级信息中的至少一个; 所述事件属 性信息包括事件类型信息、 事件时间
信息和事 件状态信息中的至少一个。
12.一种数据处 理装置, 其特 征在于, 包括:
获取模块, 被 配置为获取针对目标对象在预设历史时间区间内的用户行为明细数据;
确定模块, 被 配置为确定所述用户行为明细数据中的用户属性信息和事 件属性信息;
聚合模块, 被配置为根据所述用户行为明细数据中的用户标识对所述用户属性信 息和
所述事件属性信息进 行聚合, 获得聚合数据, 其中, 所述聚合数据包括用户属性信息和事件
统计结果;
转换模块, 被配置为基于目标数据压缩结构对所述聚合数据进行格式转换, 获得所述
目标对象的用户事 件数据。权 利 要 求 书 2/3 页
3
CN 115048059 A
3
专利 数据处理方法及装置
文档预览
中文文档
25 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共25页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 00:14:55上传分享