(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210964062.9
(22)申请日 2022.08.11
(71)申请人 福建省邮电规划设计院有限公司
地址 350001 福建省福州市 鼓楼区温泉街
道五四路1 11号宜发大厦10层
(72)发明人 林榕韬 赖大进 何健 黄灵萱
黄羽薇
(74)专利代理 机构 福州市景弘专利代理事务所
(普通合伙) 35219
专利代理师 池明霞
(51)Int.Cl.
G06F 16/35(2019.01)
G06F 40/30(2020.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)G06Q 50/00(2012.01)
(54)发明名称
一种舆情监控方法及存 储介质
(57)摘要
一种舆情监控方法及 存储介质, 其中方法包
括如下步骤, S1、 建设预处理的文本语料库; S2、
搭建构建分类网络模型, 包括以下结构: 词嵌入
层, 将输入的半结构化语料进行词嵌入训练, 将
语料转化为结构化向量; 第一转换层, 所述第一
转换层用于获取词向量的上下文信息并传入下
一层; 第二转换层, 所述第二转换层用于获取所
述第一转换层的输出, 并对所述第一转换层的输
出进行self ‑attention计算后传入下一层。 通过
上述方案, 利用设计的双 向LSTM输出、 第一转换
层和第二转换层配合使用, 进行自注 意力算法能
够让模型学习跨层的信息, 能够让文本获取到更
丰富的特征, 最终达到针对舆情内容进行更好地
处理的分析系统。
权利要求书2页 说明书7页 附图3页
CN 115422354 A
2022.12.02
CN 115422354 A
1.一种舆情监控方法, 其特 征在于, 包括如下步骤,
S1、 建设预处理的文本语料库;
S2、 搭建构建 分类网络模型, 包括以下 结构:
词嵌入层, 将输入的半结构化语料进行词嵌入训练, 将语料转 化为结构化向量;
第一转换层, 所述第一 转换层用于获取词向量的上 下文信息并传入下一层;
第二转换层, 所述第二转换层用于获取所述第一转换层的输出, 并对所述第一转换层
的输出进行self ‑attention计算后传入下一层;
双向LSTM层, 用于获得词向量的上 下文信息并输出;
向量跳远连接层, 用于将所述第一转换层和所述第 二转换层的输出与双向LSTM网络的
输出进行拼接, 使用可训练的权 重进行加权融合;
单向LSTM层, 接收加权融合后的向量;
最大池化层, 使用最大池化方式对矩阵向量降维;
Softmax层, 输出分类结果;
S3、 将所述构建好的文本语料库送入所述分类网络模型, 对所述分类网络模型进行训
练和优化;
S4、 基于训练完成的所述分类网络模型, 对所述舆情数据进行计算分析, 输出其文本情
感、 态度、 分类标签。
2.根据权利 要求1所述的舆情监控方法, 其特征在于, 所述词嵌入层的输入为(64,100,
1)的训练数据, 将每 个分词表征为128维的词向量, 该层输出为(64,128,128)的向量。
3.根据权利要求1所述的舆情监控方法, 其特征在于, 所述第一转换层的输入为(64,
128,128)的向量, 参数设置为: encoder: 数量为6, hea d: 数量设为8, 特征数量为128, 该层输
出为(64,128,128)的向量。
4.根据权利要求1所述的舆情监控方法, 其特征在于, 所述第二转换层的输入为(64,
128,128)的向量, 参数设置为: encoder: 数量为6, hea d: 数量设为8, 特征数量为128, 该层输
出为(64,128,128)的向量。
5.根据权利要求1所述的舆情监控方法, 其特征在于, 所述向量跳远连接层用于将所述
双向LSTM输出与所述第一转换层的输出和所述第二转换侧给的输出进行拼接, 输出为(64,
128,512)的向量。
6.一种舆情监控存储介质, 其特征在于, 存储有计算机程序, 所述计算机程序在被运行
时将执行包括如下步骤,
S1、 建设预处理的文本语料库;
S2、 搭建构建 分类网络模型, 包括以下 结构:
词嵌入层, 将输入的半结构化语料进行词嵌入训练, 将语料转 化为结构化向量;
第一转换层, 所述第一 转换层用于获取词向量的上 下文信息并传入下一层;
第二转换层, 所述第二转换层用于获取所述第一转换层的输出, 并对所述第一转换层
的输出进行self ‑attention计算后传入下一层;
双向LSTM层, 用于获得词向量的上 下文信息并输出;
向量跳远连接层, 用于将所述第一转换层和所述第 二转换层的输出与双向LSTM网络的
输出进行拼接, 使用可训练的权 重进行加权融合;权 利 要 求 书 1/2 页
2
CN 115422354 A
2单向LSTM层, 接收加权融合后的向量;
最大池化层, 使用最大池化方式对矩阵向量降维;
Softmax层, 输出分类结果;
S3、 将所述构建好的文本语料库送入所述分类网络模型, 对所述分类网络模型进行训
练和优化;
S4、 基于训练完成的所述分类网络模型, 对所述舆情数据进行计算分析, 输出其文本情
感、 态度、 分类标签。
7.根据权利要求6所述的舆情监控存储介质, 其特征在于, 所述词嵌入层的输入为(64,
100,1)的训练数据, 将每 个分词表征为128维的词向量, 该层输出为(64,128,128)的向量。
8.根据权利要求6所述的舆情监控存储介质, 其特征在于, 所述第一转换层的输入为
(64,128,128)的向量, 参数设置为: encoder: 数量为6, h ead: 数量 设为8, 特征数量为128, 该
层输出为(64,128,128)的向量。
9.根据权利要求6所述的舆情监控存储介质, 其特征在于, 所述第二转换层的输入为
(64,128,128)的向量, 参数设置为: encoder: 数量为6, h ead: 数量 设为8, 特征数量为128, 该
层输出为(64,128,128)的向量。
10.根据权利要求6所述的舆情监控存储介质, 其特征在于, 所述向量跳远连接层用于
将所述双向LSTM输出与所述第一转换层的输出和所述第二转换侧给的输出进 行拼接, 输出
为(64,128,512)的向量。权 利 要 求 书 2/2 页
3
CN 115422354 A
3
专利 一种舆情监控方法及存储介质
文档预览
中文文档
13 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-03-03 12:14:13上传分享