公共安全标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210964062.9 (22)申请日 2022.08.11 (71)申请人 福建省邮电规划设计院有限公司 地址 350001 福建省福州市 鼓楼区温泉街 道五四路1 11号宜发大厦10层 (72)发明人 林榕韬 赖大进 何健 黄灵萱  黄羽薇  (74)专利代理 机构 福州市景弘专利代理事务所 (普通合伙) 35219 专利代理师 池明霞 (51)Int.Cl. G06F 16/35(2019.01) G06F 40/30(2020.01) G06N 3/04(2006.01) G06N 3/08(2006.01)G06Q 50/00(2012.01) (54)发明名称 一种舆情监控方法及存 储介质 (57)摘要 一种舆情监控方法及 存储介质, 其中方法包 括如下步骤, S1、 建设预处理的文本语料库; S2、 搭建构建分类网络模型, 包括以下结构: 词嵌入 层, 将输入的半结构化语料进行词嵌入训练, 将 语料转化为结构化向量; 第一转换层, 所述第一 转换层用于获取词向量的上下文信息并传入下 一层; 第二转换层, 所述第二转换层用于获取所 述第一转换层的输出, 并对所述第一转换层的输 出进行self ‑attention计算后传入下一层。 通过 上述方案, 利用设计的双 向LSTM输出、 第一转换 层和第二转换层配合使用, 进行自注 意力算法能 够让模型学习跨层的信息, 能够让文本获取到更 丰富的特征, 最终达到针对舆情内容进行更好地 处理的分析系统。 权利要求书2页 说明书7页 附图3页 CN 115422354 A 2022.12.02 CN 115422354 A 1.一种舆情监控方法, 其特 征在于, 包括如下步骤, S1、 建设预处理的文本语料库; S2、 搭建构建 分类网络模型, 包括以下 结构: 词嵌入层, 将输入的半结构化语料进行词嵌入训练, 将语料转 化为结构化向量; 第一转换层, 所述第一 转换层用于获取词向量的上 下文信息并传入下一层; 第二转换层, 所述第二转换层用于获取所述第一转换层的输出, 并对所述第一转换层 的输出进行self ‑attention计算后传入下一层; 双向LSTM层, 用于获得词向量的上 下文信息并输出; 向量跳远连接层, 用于将所述第一转换层和所述第 二转换层的输出与双向LSTM网络的 输出进行拼接, 使用可训练的权 重进行加权融合; 单向LSTM层, 接收加权融合后的向量; 最大池化层, 使用最大池化方式对矩阵向量降维; Softmax层, 输出分类结果; S3、 将所述构建好的文本语料库送入所述分类网络模型, 对所述分类网络模型进行训 练和优化; S4、 基于训练完成的所述分类网络模型, 对所述舆情数据进行计算分析, 输出其文本情 感、 态度、 分类标签。 2.根据权利 要求1所述的舆情监控方法, 其特征在于, 所述词嵌入层的输入为(64,100, 1)的训练数据, 将每 个分词表征为128维的词向量, 该层输出为(64,128,128)的向量。 3.根据权利要求1所述的舆情监控方法, 其特征在于, 所述第一转换层的输入为(64, 128,128)的向量, 参数设置为: encoder: 数量为6, hea d: 数量设为8, 特征数量为128, 该层输 出为(64,128,128)的向量。 4.根据权利要求1所述的舆情监控方法, 其特征在于, 所述第二转换层的输入为(64, 128,128)的向量, 参数设置为: encoder: 数量为6, hea d: 数量设为8, 特征数量为128, 该层输 出为(64,128,128)的向量。 5.根据权利要求1所述的舆情监控方法, 其特征在于, 所述向量跳远连接层用于将所述 双向LSTM输出与所述第一转换层的输出和所述第二转换侧给的输出进行拼接, 输出为(64, 128,512)的向量。 6.一种舆情监控存储介质, 其特征在于, 存储有计算机程序, 所述计算机程序在被运行 时将执行包括如下步骤, S1、 建设预处理的文本语料库; S2、 搭建构建 分类网络模型, 包括以下 结构: 词嵌入层, 将输入的半结构化语料进行词嵌入训练, 将语料转 化为结构化向量; 第一转换层, 所述第一 转换层用于获取词向量的上 下文信息并传入下一层; 第二转换层, 所述第二转换层用于获取所述第一转换层的输出, 并对所述第一转换层 的输出进行self ‑attention计算后传入下一层; 双向LSTM层, 用于获得词向量的上 下文信息并输出; 向量跳远连接层, 用于将所述第一转换层和所述第 二转换层的输出与双向LSTM网络的 输出进行拼接, 使用可训练的权 重进行加权融合;权 利 要 求 书 1/2 页 2 CN 115422354 A 2单向LSTM层, 接收加权融合后的向量; 最大池化层, 使用最大池化方式对矩阵向量降维; Softmax层, 输出分类结果; S3、 将所述构建好的文本语料库送入所述分类网络模型, 对所述分类网络模型进行训 练和优化; S4、 基于训练完成的所述分类网络模型, 对所述舆情数据进行计算分析, 输出其文本情 感、 态度、 分类标签。 7.根据权利要求6所述的舆情监控存储介质, 其特征在于, 所述词嵌入层的输入为(64, 100,1)的训练数据, 将每 个分词表征为128维的词向量, 该层输出为(64,128,128)的向量。 8.根据权利要求6所述的舆情监控存储介质, 其特征在于, 所述第一转换层的输入为 (64,128,128)的向量, 参数设置为: encoder: 数量为6, h ead: 数量 设为8, 特征数量为128, 该 层输出为(64,128,128)的向量。 9.根据权利要求6所述的舆情监控存储介质, 其特征在于, 所述第二转换层的输入为 (64,128,128)的向量, 参数设置为: encoder: 数量为6, h ead: 数量 设为8, 特征数量为128, 该 层输出为(64,128,128)的向量。 10.根据权利要求6所述的舆情监控存储介质, 其特征在于, 所述向量跳远连接层用于 将所述双向LSTM输出与所述第一转换层的输出和所述第二转换侧给的输出进 行拼接, 输出 为(64,128,512)的向量。权 利 要 求 书 2/2 页 3 CN 115422354 A 3

PDF文档 专利 一种舆情监控方法及存储介质

文档预览
中文文档 13 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种舆情监控方法及存储介质 第 1 页 专利 一种舆情监控方法及存储介质 第 2 页 专利 一种舆情监控方法及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:14:13上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。