公共安全标准网
(19)国家知识产权局 (12)发明 专利 (10)授权公告 号 (45)授权公告日 (21)申请 号 202210903112.2 (22)申请日 2022.07.29 (65)同一申请的已公布的文献号 申请公布号 CN 114970553 A (43)申请公布日 2022.08.30 (73)专利权人 北京道达天际科技股份有限公司 地址 100085 北京市海淀区马连洼北路8号 C座7层70 3室 (72)发明人 王吉平 杨晓冬  (74)专利代理 机构 北京华专卓 海知识产权代理 事务所(普通 合伙) 11664 专利代理师 王一 张继鑫 (51)Int.Cl. G06F 40/30(2020.01) G06N 3/04(2006.01)G06F 16/34(2019.01) G06F 16/35(2019.01) (56)对比文件 CN 114356967 A,202 2.04.15 CN 111950273 A,2020.1 1.17 CN 112784602 A,2021.0 5.11 CN 114330322 A,2022.04.12 CN 110263165 A,2019.09.20 CN 114610871 A,202 2.06.10 WO 2022078102 A1,202 2.04.21 柯尊旺.网络 舆情分析若干关键理论及应用 研究. 《中国博士学位 论文全文数据库 社会科 学 Ⅱ辑》 .2022,H123-10. 审查员 苏春昊 (54)发明名称 基于大规模 无标注语料的情报分析方法、 装 置及电子设备 (57)摘要 本公开的实施例提供了一种基于大规模无 标注语料的情报分析方法、 装置及电子设备, 涉 及数据分类技术领域。 所述方法包括: 建立主题 模型, 获取情报中的关键词; 对情报进行摘要提 取, 获取摘要信息和情报文档级信息; 对情报进 行倾向性分析, 并添加倾向分类标签; 对情报进 行时间序列分析, 得到时序分类结果; 根据情报 对应的关键词、 摘要信息、 倾向性分类标签、 时序 分类结果中的一个或多个, 结合地理空间信息及 其他情报素材, 对情报进行分析。 以此方式, 可以 提高情报信息处理能力, 且经处理后的情报分类 清晰, 查找容 易, 大大提高后续的情 报查找效率。 权利要求书2页 说明书8页 附图2页 CN 114970553 B 2022.11.08 CN 114970553 B 1.一种基于大规模无 标注语料的情 报分析方法, 其特 征在于, 包括: 建立主题模型, 获取情 报中的关键词; 对情报进行摘要提取, 获取摘要信息和情 报文档级信息; 对情报进行倾向性分析, 并添加倾向分类标签; 对情报进行时间序列分析, 得到时序分类结果; 根据情报对应的关键词、 摘要信息、 倾向性分类标签、 时序分类结果中的一个或多个, 结合地理空间信息及其 他情报素材, 对情报进行分析; 其中, 所述对情 报进行倾向性分析, 并添加倾向分类标签包括: 采用双向LSTM网络, 对情 报摘要信息进行倾向性分析, 并添加倾向分类标签; 所述对情 报进行时间序列分析, 得到时序分类结果包括: 采用双向LSTM网络, 获取上下文信息, 根据上下文信息对情报进行时间序列分析, 得到 时序分类结果; 将倾向分类标签与时间序列结合分析, 得到情 报的因果关系。 2.根据权利要求1所述的基于大规模无标注语料的情报分析方法, 其特征在于, 所述获 取情报中的关键词包括: 在主题描述中保留与主题相关的字词作为情报中的关键词, 并应用LDAvis可视化展现 分析。 3.根据权利要求1所述的基于大规模无标注语料的情报分析方法, 其特征在于, 所述对 情报进行摘要提取, 获取摘要信息和情 报文档级信息包括: 将每份情报中的句子进行向量化表示, 根据句子向量获取摘要信息和情报文档级信 息。 4.根据权利要求3所述的基于大规模无标注语料的情报分析方法, 其特征在于, 所述将 每份情报中的句子进行向量 化表示包括: 将每份情报中的句子 输入预先训练好的BERT模型, 输出句子向量。 5.根据权利要求4所述的基于大规模无标注语料的情报分析方法, 其特征在于, BERT模 型训练过程包括: 利用平行语料对BERT模型进行 预训练; 根据情报分类任务、 情 报特征向量、 情 报实体命名中的一个或多个对BERT模型微调。 6.根据权利要求1所述的基于大规模无标注语料的情报分析方法, 其特征在于, 所述根 据上下文信息对情 报进行时间序列分析包括: 根据上下文信息, 结合 倾向分类标签以及上 下文信息对情 报进行时间序列分析。 7.一种基于大规模无 标注语料的情 报分析装置, 其特 征在于, 包括: 关键词提取 单元, 用于建立主题模型, 获取情 报中的关键词; 摘要提取 单元, 用于对情 报进行摘要提取, 获取摘要信息和情 报文档级信息; 标注单元, 用于对情报进行倾向性分析, 并添加倾向分类标签; 所述对情报进行倾向性 分析, 并添加倾向分类标签包括: 采用双向LSTM网络, 对情报摘要信息进行倾向性分析, 并 添加倾向分类标签; 时序分析单元, 用于对情报进行时间序列分析, 得到时序分类结果; 所述对情报进行时 间序列分析, 得到时序分类结果包括: 采用双向LSTM网络, 获取上下文信息, 根据上下文信权 利 要 求 书 1/2 页 2 CN 114970553 B 2息对情报进行时间序列分析, 得到时序分类结果; 综合分析单元, 用于根据情报对应的关键词、 摘要信息、 倾向性分类标签、 时序分类结 果中的一个或多个, 结合地理空间信息及其他情报素材, 对情报进 行分析, 将倾向分类标签 与时间序列结合分析, 得到情 报的因果关系。 8.一种电子设备, 包括: 至少一个处理器; 以及与 所述至少一个处理器通信连接的存储 器; 其特征在于, 所述存储器存储有 可被所述至少一个处理器执行的指令, 所述指令被所述 至少一个处理器执行, 以使所述至少一个处理器能够执行权利要求1 ‑6中任一项所述的方 法。权 利 要 求 书 2/2 页 3 CN 114970553 B 3

PDF文档 专利 基于大规模无标注语料的情报分析方法、装置及电子设备

文档预览
中文文档 13 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于大规模无标注语料的情报分析方法、装置及电子设备 第 1 页 专利 基于大规模无标注语料的情报分析方法、装置及电子设备 第 2 页 专利 基于大规模无标注语料的情报分析方法、装置及电子设备 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:14:23上传分享
友情链接
交流群
  • //public.wenku.github5.com/wodemyapi/22.png
-->
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。