公共安全标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211355172.1 (22)申请日 2022.11.01 (71)申请人 潍坊医学院附属医院 地址 261041 山 东省潍坊市奎文区虞河路 2428号 (72)发明人 刘静 孙立文 董世新 于谦  刘淑君 孟晓亮  (74)专利代理 机构 北京中索 知识产权代理有限 公司 11640 专利代理师 李永臻 (51)Int.Cl. G06F 16/9535(2019.01) G06F 16/9035(2019.01) G06N 20/00(2019.01) (54)发明名称 基于数据挖掘的信息智能处 理方法及系统 (57)摘要 本发明涉及信息处理领域, 尤其涉及一种基 于数据挖掘的信息智能处理方法及系统, 该方法 包括: 接收若干待模拟信息; 根据创建时间将待 模拟处理信息按预设比例分为训练集和测试集, 获取训练集中待模拟处理信息的特征信息, 对 标 注的特征信息进行处理, 进行挖掘模 型训练和测 试; 利用挖掘模 型提取第一特征信息并与特征信 息库进行匹配和推送目标信息; 利用挖掘模型提 取第二特征信息并与特征信息库的第一特征信 息进行匹配, 根据匹配结果决策是否对第一特征 信息进行更新。 通过对挖掘模型训练和测试提高 了挖掘模型的准确性, 挖掘模型进行特征信息挖 掘, 根据特征信息为用户进行准确推送, 并定期 更新第一特 征信息, 提高推送的准确性。 权利要求书3页 说明书8页 附图2页 CN 115510330 A 2022.12.23 CN 115510330 A 1.一种基于数据 挖掘的信息智能处 理方法, 其特 征在于, 包括: 接收若干待模拟信息, 所述待模拟信息包括模拟用户基本信息和待模拟处理信息, 所 述模拟用户基本信息包括模拟用户ID和创建时间, 将待模拟处理信息与模拟用户ID进 行关 联; 根据所述创建时间将所述待模拟处理信息根据用户ID按预设比例分为训练集和测试 集, 获取训练集中已标注好的待模拟处理信息的特征信息, 对标注的特征信息进 行处理, 将 处理的特征信息对应的待模拟处理信息进 行挖掘模型训练, 将训练完成的挖掘模型在测试 集上进行测试, 若测试成功, 则完成挖掘模型的训练, 若测试失败, 则继续对挖掘模型进行 训练; 在完成挖掘模型训练后, 获取用户基本信息和待处理信息, 用户基本信息包括用户ID, 将所述用户基本信息进 行分析, 判断所述待处理信息是否为空, 若不为空, 则将待处理信息 利用挖掘模型提取第一特征信息, 根据提取 的第一特征信息对待处理信息进行打标签, 生 成目标信息, 标签内容为第一特征信息, 用户基本信息包括用户ID, 将第一特征信息与用户 ID进行关联, 将关联后的第一特 征信息存 储到特征信息库; 将所述第一特征信 息与所述特征信 息库进行匹配, 将匹配到的第 一特征信 息对应的目 标信息发送到对应用户ID的用户端 进行显示; 在预设时间时, 获取用户ID的历史记录信 息, 对历史记录信 息进行筛选, 得到目标历史 记录信息, 将所述 目标历史记录信息利用挖掘模型提取第二特征信息, 将所述第二特征信 息与所述特征信息库中相同用户ID的所述第一特征信息进 行匹配, 根据匹配结果决策是否 对第一特 征信息进行 更新。 2.根据权利要求1所述的基于数据挖掘的信 息智能处理方法, 其特征在于, 在对标注的 特征信息进 行处理时, 特征信息包括对象名称、 对象类别和对象轮廓, 根据对象类别对特征 信息进行划分, 统计任意用户ID的标注的特征信息的对象类别数量, 将对 象类别数量最多 的特征信息生成目的特 征信息。 3.根据权利要求2所述的基于数据挖掘的信 息智能处理方法, 其特征在于, 将任意对象 类别的标注的特征信息中对象名称和对象轮廓进 行关联和存储, 对比各个对象名称对应的 待模拟处理信息的相邻帧图像中的对象轮廓是否相同, 计算重合率P, P=N/M, 其中, N为重 合次数, M为对比总次数, 将重合 率P与预设重合 率P0进行对比, 若P≥P0, 则判定该待模拟处 理信息的相邻帧图像的对象轮廓重合 率高; 若P<P0, 则判定该待模拟处 理信息的相邻帧图像的对象轮廓重合 率低。 4.根据权利要求3所述的基于数据挖掘的信 息智能处理方法, 其特征在于, 在判定待模 拟处理信息的相邻帧图像的对象轮廓重合率高时, 统计相同用户ID的各个待模拟处理信息 的相邻帧图像的对象轮廓重合率高的数量E, 将对象轮廓重合率高的数量E与预设对象轮廓 重合率高的数量E 0, 若E≥E0, 则判定各个待模拟处理信息的相邻帧图像的对象轮廓重合率高的容易等级 为一级; 若E<E0, 则判定各个待模拟处理信息的相邻帧图像的对象轮廓重合率高的容易等级 为二级; 其中, 一级>二级。 5.根据权利要求4所述的基于数据挖掘的信 息智能处理方法, 其特征在于, 判定各个待权 利 要 求 书 1/3 页 2 CN 115510330 A 2模拟处理信息的相邻帧图像的对 象轮廓重合率高的容易等级为一级时, 则调整挖掘规则, 当F≥F0时, 其中, F为任意待模拟处理信息的帧数F, F0为预设帧数, 则将每间隔k帧进行一 次挖掘, 其中, k 为预设间隔帧数, 当F<F0时, 则逐帧进行挖掘。 6.根据权利要求5所述的基于数据挖掘的信 息智能处理方法, 其特征在于, 在判断所述 待处理信息是否为空时, 若为空, 所述用户基本信息包括用户头像和用户介绍, 对所述用户 头像进行实体识别, 得到目标实体和实体名称, 将用户介绍的文本信息进 行关键词提取, 根 据预设关键词 库对用户介绍的文本信息进 行关键词提取, 将提取的关键词 与实体名称进 行 匹配, 若匹配成功, 则将匹配成功的关键词作为第一特征信息, 若匹配不成功, 则获取关键 词和实体名称的类别, 将类别相同的类别作为第一特 征信息。 7.根据权利要求6所述的基于数据挖掘的信 息智能处理方法, 其特征在于, 在获取到预 设时间内每个用户ID的历史记录信息后, 统计历史记录信息的数量k和每个历史记录信息 的触发次数h, 将历史记录信息的数量k与预设历史记录信息的数量k0进行比较, 将每个历 史记录信息的触发次数h与预设触发次数h0进 行比较, 若k>k0且h≥h0, 则将该历史记录信 息筛选出, 得到目标历史记录信息; 若k≤k0, 则将历史记录信息都作为目标历史记录信息 。 8.根据权利要求7所述的基于数据挖掘的信 息智能处理方法, 其特征在于, 在决策是否 对所述第一特征信息进 行更新时, 根据匹配结果进 行决策, 若匹配失败, 则根据第二特征信 息对第一特 征信息进行 更新, 若匹配成功, 则不对第一特 征信息进行 更新。 9.一种应用如权利要求1 ‑8任一所述的基于数据挖掘的信 息智能处理方法的基于数据 挖掘的信息智能处 理系统, 其特 征在于, 该系统包括: 接收模块, 用以接收若干待模拟信息, 所述待模拟信息包括模拟用户基本信息和待模 拟处理信息, 所述模拟用户基本信息包括模拟用户ID和创建时间, 将待模拟处理信息与模 拟用户ID进行关联; 构建模块, 用以根据 所述创建时间将所述待模拟处理信 息根据用户ID按预设比例分为 训练集和测试集, 获取训练集中已标注好的待模拟处理信息的特征信息, 对标注的特征信 息进行处理, 将处理的特征信息对应的待模拟处理信息进行挖掘模型训练, 将训练完成的 挖掘模型在测试集上进行测试, 若测试成功, 则完成挖掘模型的训练, 若测试失败, 则继续 对挖掘模型进行训练; 处理模块, 用以在完成挖掘模型训练后, 获取用户基本信 息和待处理信息, 用户基本信 息包括用户ID, 将所述用户基本信息进行分析, 判断所述待处理信息是否为空, 若不为空, 则将待处理信息利用挖掘模型提取第一特征信息, 根据提取的第一特征信息给待处理信息 进行打标签, 生成目标信息, 标签内容为第一特征信息, 用户基本信息包括用户ID, 将第一 特征信息与用户ID进行关联, 将关联后的第一特 征信息存 储到特征信息库; 匹配模块, 用以将所述第一特征信息与所述特征信息库进行匹配, 将匹配到的第一特 征信息对应的目标信息发送到对应用户ID的用户端 进行显示; 更新模块, 用以在预设时间时, 获取用户ID的历史记录信息, 将所述历史记录信息利用 挖掘模型提取第二特征信息, 将所述第二特征信息与所述特征信息库中相同用户ID的所述 第一特征信息进行匹配, 若匹配失败, 则根据第二特征信息对第一特征信息进 行更新, 若匹 配成功, 则不对第一特 征信息进行 更新。 10.根据权利要求9所述的基于数据挖掘的信息智能处理系统, 其特征在于, 所述构建权 利 要 求 书 2/3 页 3 CN 115510330 A 3

.PDF文档 专利 基于数据挖掘的信息智能处理方法及系统

文档预览
中文文档 14 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于数据挖掘的信息智能处理方法及系统 第 1 页 专利 基于数据挖掘的信息智能处理方法及系统 第 2 页 专利 基于数据挖掘的信息智能处理方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 00:13:53上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。