公共安全标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211037318.8 (22)申请日 2022.08.26 (71)申请人 广州工程 技术职业学院 地址 510000 广东省广州市越秀区环市东 路465号 (72)发明人 曹惠茹 王世安 何勰绯 王毅  (74)专利代理 机构 广州广典知识产权代理事务 所(普通合伙) 44365 专利代理师 王东平 谢伟 (51)Int.Cl. G06F 16/9536(2019.01) G06F 40/194(2020.01) G06F 40/30(2020.01) G06K 9/62(2022.01) G06Q 50/00(2012.01) (54)发明名称 网络社区虚假信息快速识别方法及装置、 设 备、 存储介质 (57)摘要 本发明属于文本信息处理技术领域, 公开了 一种网络 社区虚假信息快速识别方法及装置、 设 备、 存储介质, 通过将网络社区上出现的用户关 注值较大的候选主题确定为热点主题, 并将用户 关注值在一定时间内具有较大程度上升的热点 主题确定为价值主题, 视为可能造成影 响的有价 值进行虚假信息识别的价值主题, 从而可以排除 掉可能不会造成影 响或影响较小的无价值主题, 也即本发明可以动态获取网络社区上新发表的 主题筛选 出高价值主题, 实时更新虚假文本数据 库, 并仅针对筛选出的高价值主题进行虚假信息 识别, 可以考虑到对网络社区某个主题进行虚假 信息识别的价值, 使 得识别方法具有更好的适应 性, 进而在实现高效识别的同时以较大幅度的提 高识别准确率。 权利要求书2页 说明书8页 附图2页 CN 115374372 A 2022.11.22 CN 115374372 A 1.网络社区虚假信息快速识别方法, 其特 征在于, 包括: 获取网络社区在第一时刻出现的多个候选主题; 计算每个所述候选主题在第一时刻的第一用户关注值; 将所述第一用户关注值大于第一阈值的候选主题确定为热点主题; 计算每个所述热点主题在第二时刻的第二用户关注值; 将第二用户关注值高于第一用户关注值且两者的差分值大于第二阈值的热点主题确 定为价值主题; 所述第二阈值小于所述第一阈值; 获取与每 个所述价值主题相关的多个典型虚假文本; 将多个典型虚假文本与相应的价 值主题进行关联存 储; 获取所述网络社区在第三时刻出现的文本信息; 从多个所述价值主题中调取与所述文本信 息相匹配的目标价值主题, 并调取与所述目 标价值主题关联的多个目标典型虚假文本; 计算所述文本信息与每 个所述目标典型虚假文本之间的相似度; 将所述相似度的最大值确定为所述文本信息的虚假度; 若所述虚假度达 到第三阈值, 判定所述文本信息为虚假信息 。 2.如权利要求1所述的网络社区虚假信 息快速识别方法, 其特征在于, 获取与每个所述 价值主题相关的多个典型虚假文本, 包括: 对每个所述价值主题进行语义 提取, 获得语义信息; 将所述价值主题及其所述语义信息推送至所述网络社区的指定用户节点; 接收所述指定用户节点采集到的用户输入的语料信息; 从所述语料信息中提取 出与每个所述价值主题相关的多个典型虚假文本 。 3.如权利要求2所述的网络社区虚假信 息快速识别方法, 其特征在于, 判定所述文本信 息为虚假信息之后, 所述方法还 包括: 将所述虚假信息作为所述目标价 值主题的典型虚假文本进行关联存 储。 4.如权利要求1至3任一项所述的网络社区虚假信息快速识别方法, 其特征在于, 计算 每个所述候选主题在第一时刻的第一用户关注值, 包括: 统计每个所述候选主题在第一时刻的评论用户数和阅读用户数; 根据每个所述候选主题在第 一时刻的评论用户数和阅读用户数, 计算每个所述候选主 题在第一时刻的第一用户关注值。 5.如权利要求1至3任一项所述的网络社区虚假信息快速识别方法, 其特征在于, 计算 所述文本信息与每 个所述目标典型虚假文本之间的相似度, 包括: 获取每个所述目标典型虚假文本的候选分词向量; 对所述文本信息进行分词处 理, 获得目标分词向量; 计算所述目标分词向量与每个所述目标典型虚假文本的候选分词向量之间的夹角余 弦值作为相似度。 6.网络社区虚假信息快速识别装置, 其特 征在于, 包括: 主题获取 单元, 用于获取网络社区在第一时刻出现的多个候选主题; 第一计算单 元, 用于计算每 个所述候选主题在第一时刻的第一用户关注值; 热点确定单元, 用于将所述第一用户关注值大于第一阈值的候选主题确定为热点主权 利 要 求 书 1/2 页 2 CN 115374372 A 2题; 第二计算单 元, 用于计算每 个所述热点主题在第二时刻的第二用户关注值; 价值确定单元, 用于将第 二用户关注值高于第 一用户关注值且两者的差分值大于第 二 阈值的热点主题确定为 价值主题; 所述第二阈值小于所述第一阈值; 建库单元, 用于获取与每 个所述价值主题相关的多个典型虚假文本; 存储单元, 用于将多个典型虚假文本与相应的价 值主题进行关联存 储; 监测单元, 用于获取 所述网络社区在第三时刻出现的文本信息; 调取单元, 用于从多个所述价值主题中调取与所述文本信息相匹配的目标价值主题, 并调取与所述目标价 值主题关联的多个目标典型虚假文本; 对比单元, 用于计算所述文本信息与每个所述目标典型虚假文本之间的相似度; 以及, 将所述相似度的最大值确定为所述文本信息的虚假度; 判定单元, 用于在所述虚假度达 到第三阈值时, 判定所述文本信息为虚假信息 。 7.如权利要求6所述的网络社区虚假信 息快速识别装置, 其特征在于, 所述建库单元包 括: 第一提取子单 元, 用于对每 个所述价值主题进行语义 提取, 获得语义信息; 推送子单元, 用于将所述价值主题及其所述语义信 息推送至所述网络社区的指定用户 节点; 接收子单 元, 用于接收所述指定用户节点采集到的用户输入的语料信息; 第二提取子单元, 用于从所述语料信 息中提取出与每个所述价值主题相关的多个典型 虚假文本 。 8.如权利要求7 所述的网络社区虚假信息快速识别装置, 其特 征在于, 所述存储单元, 还用于在所述判定单元判定所述文本信息为虚假信息之后, 将所述虚 假信息作为所述目标价 值主题的典型虚假文本进行关联存 储。 9.电子设备, 其特征在于, 包括存储有可执行程序代码的存储器以及与所述存储器耦 合的处理器; 所述处理器调用所述存储器中存储的所述可执行程序代码, 用于执行权利要 求1至5任一项所述的网络社区虚假信息快速识别方法。 10.计算机可读存储介质, 其特征在于, 所述计算机可读存储介质存储计算机程序, 其 中, 所述计算机程序使 得计算机执行权利要求 1至5任一项 所述的网络社区虚 假信息快速识 别方法。权 利 要 求 书 2/2 页 3 CN 115374372 A 3

PDF文档 专利 网络社区虚假信息快速识别方法及装置、设备、存储介质

文档预览
中文文档 13 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 网络社区虚假信息快速识别方法及装置、设备、存储介质 第 1 页 专利 网络社区虚假信息快速识别方法及装置、设备、存储介质 第 2 页 专利 网络社区虚假信息快速识别方法及装置、设备、存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:14:01上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。