公共安全标准网
文库搜索
切换导航
文件分类
频道
联系我们
问题反馈
文件分类
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利 (10)授权公告 号 (45)授权公告日 (21)申请 号 202210971146.5 (22)申请日 2022.08.15 (65)同一申请的已公布的文献号 申请公布号 CN 115062229 A (43)申请公布日 2022.09.16 (73)专利权人 广东工业大 学 地址 510006 广东省广州市番禺区广州大 学城外环西路10 0号 (72)发明人 张翔 陈平华 (74)专利代理 机构 北京东方盛凡知识产权代理 有限公司 1 1562 专利代理师 张国麒 (51)Int.Cl. G06F 16/9535(2019.01) G06N 3/04(2006.01)G06F 16/335(2019.01) G06F 16/35(2019.01) G06F 40/216(2020.01) G06F 40/30(2020.01) 审查员 邓慧丽 (54)发明名称 基于新闻评论的过滤以及情感分析方法 (57)摘要 本发明提供了基于新闻评论的过滤以及情 感分析方法, 包括: 对新闻评论进行过滤, 获取有 效评论集合; 其中, 所述有效评论集合中包括新 闻与所述新闻评论的方面词集合; 构建情感分析 模型, 将所述有效评论集合与所述方面词集合输 入至所述情感分析模型中, 获取情感倾向结果。 本发明通过设置有效的筛选机制, 能够过滤无效 的用户评论数据, 搭建了更加精确有效的模型可 以针对文本的特定方面进行定向的情感倾向分 析, 获得精准的用户情感倾向结果。 权利要求书2页 说明书8页 附图3页 CN 115062229 B 2022.11.11 CN 115062229 B 1.基于新闻评论的过 滤以及情感分析 方法, 其特 征在于, 包括: 对新闻评论进行过滤, 获取有效评论集合; 其中, 所述有效评论集合中包括新闻与所述 新闻评论的方面词集 合; 构建情感分析模型, 将所述有 效评论集合与所述方面词集合输入至所述情 感分析模型 中, 获取情感倾向结果; 获取有效评论 集合包括: 提取新闻与所述新闻评论中的所述方面词集合, 筛选出含有方面词集合的新闻评论, 与不含方面词集 合的新闻评论; 提取所述新闻的中心句; 采用Bert模型提取所述不含方面词集合的新闻评论的句意和所述中心句的句意, 预设 相似度阈值, 比较所述不含方面词集合的新闻评论的句意和所述中心句的句意的相似度, 将达到所述相似度阈值的所述 不含方面词集 合的新闻评论进行召回; 将所述含有方面词集合的新闻评论, 与达到所述相似度阈值的所述不含方面词集合的 新闻评论进行 结合, 获得 所述有效评论 集合; 所述情感分析模型包括: 词嵌入层、 一维卷积层、 方面词卷积层和分类 器; Bert模型采用Transformer的Encoder模块, 多层堆积将文本提取成包含语义的高维特 征向量, 在高维特 征向量之间做相似度的计算; 所述Bert模型对文本生成对应的高维特 征向量的方式为: 将所述中心句和所述不含方面词集合的新闻评论按词语为单位, 用训练好的嵌入矩阵 映射成高维向量, 将两个taken序列拼接起来, 两个序列之间用分割token作为分开两个句 子的标识并在序列开头拼接相 似度token, 再将各个位置的词嵌入向量与对应的位置嵌入 向量进行相加作为输入进入Tran sformer Encoder模块, 在所述Transformer Encoder模 块 中进行self ‑attention计算各个token的加权和, 再进入全 连接层以及残差结构, 经过若干 所述Transformer Encoder模块最后 得到的相似度token就能衡量中心句与目标评论的语 义相似度; 将所述有效评论 集合输入至所述情感分析模型中, 获取情感倾向结果包括: 将所述有 效评论集合及对应的所述方面词集合输入至所述词嵌入层, 对所述有 效评论 集合及所述方面词集合进行词嵌入转换, 获取所述有效评论集合的特征矩阵及方面词向 量; 所述特征矩阵进入所述一维卷积层, 进行反复叠加卷积、 池化操作, 获取高阶局部特征 矩阵; 所述高阶局部特征矩阵进入所述方面词卷积层, 由方面词向量生成对应卷积核对所述 高阶局部特 征进行卷积处理, 获取特征值拼接成的高阶特 征向量; 所述高阶特征向量进入所述分类器, 进行低维映射并压缩, 在通过激活函数, 得到最终 方面词对应的情感倾向概 率输出。 2.根据权利要求1所述的基于新闻评论的过滤以及情感分析方法, 其特征在于, 提取新 闻与所述新闻评论中的所述方面词集合包括: 使用jieba分词中的搜索引擎模式, 对所述新 闻与所述 新闻评论进行分词, 获取文本最小单位的所述方面词集 合。 3.根据权利要求2所述的基于新闻评论的过滤以及情感分析方法, 其特征在于, 提取所权 利 要 求 书 1/2 页 2 CN 115062229 B 2述新闻的中心句包括: 获取所述新闻中所述方面词的词频 ‑逆文件频率; 将所述新闻中每个句子 中的每个方面词的词频 ‑逆文件频率相加除以方面词数得到该 句子的词频 ‑逆文件频率, 将词频 ‑逆文件频率 最大的句子作为所述 新闻的所述中心句。 4.根据权利要求3所述的基于新闻评论的过滤以及情感分析方法, 其特征在于, 获取所 述新闻中所述方面词的词频 ‑逆文件频率包括: 计算所述方面词在当前新闻以及全部新闻 中的概率, 获取词频; 计算新闻集合总数与 所述方面词在除当前新闻外的其它新闻中是否出现的数量之比, 获取逆文件频率; 基于所述词频与所述逆文件频率组合成所述词频 ‑逆文件频率。 5.根据权利要求1所述的基于新闻评论的过滤以及情感分析方法, 其特征在于, 所述分 类器包括: 全连接层、 dropout层和激活函数。权 利 要 求 书 2/2 页 3 CN 115062229 B 3
专利 基于新闻评论的过滤以及情感分析方法
文档预览
中文文档
14 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助2元下载(无需注册)
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2元下载
本文档由 SC 于
2024-03-03 12:14:11
上传分享
举报
下载
原文档
(444.1 KB)
分享
友情链接
T-ZZB 0786—2018 台式钻床用直接驱动电机.pdf
T-FJTEA 002—2023 小白茶林下栽培技术规程.pdf
奇安信 2020年网络安全应急响应分析报告 2021.pdf
GB-T 14555-2015 船用导航雷达接口及安装要求.pdf
GB-T 14846-2014 铝及铝合金挤压型材尺寸偏差.pdf
DB5101-T54.1-2019 成都市智慧停车信息系统建设规范 第1部分:总则 成都市.pdf
GB-T 38224.1-2019 重金属废水处理与回用技术评价 第1部分:程序和方法.pdf
T-XLTDA 005—2021 地方特色乳制品 风味奶酪.pdf
DB61-T 1502-2021 电动汽车充电站(桩)验收规范 陕西省.pdf
人工智能大模型体验报告3.0.pdf
专利 一种基于SOAR的防御自动化流程编排方法.PDF
GB-T 40219-2021 拉曼光谱仪通用规范.pdf
T-BSRS 025—2020 伴生放射性矿开发利用环境辐射防护技术要求.pdf
T-CSTM 00043.6—2018 大气环境腐蚀试验 第6部分:建筑涂层材料暴露腐蚀试验.pdf
5-99-02-02 农村节能员.pdf
GB-T 22484-2016 城市公共汽电车客运服务规范.pdf
法律法规 陕西省民用建筑节能条例2016-11-24.pdf
GB-T 42467.6-2023 中医临床名词术语 第6部分:妇科学.pdf
GB-T 31191-2014 常温锰系脱氧剂脱氧性能试验方法.pdf
GB-T 40518-2021 航天工程技术成熟度评价指南.pdf
交流群
-->
1
/
14
评价文档
赞助2元 点击下载(444.1 KB)
回到顶部
×
微信扫码支付
2
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。