公共安全标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210969198.9 (22)申请日 2022.08.12 (71)申请人 南京灵越信息技 术有限公司 地址 210012 江苏省南京市雨 花台区软件 大道180号0 6栋-401室 (72)发明人 李磊 严雨莲 彭丽侠 王刚  (74)专利代理 机构 深圳博敖专利代理事务所 (普通合伙) 44884 专利代理师 冯玉兰 (51)Int.Cl. G06F 16/172(2019.01) G06F 16/35(2019.01) G06F 21/32(2013.01) G06F 21/46(2013.01) G06F 21/56(2013.01)G06F 40/30(2020.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种可对 文本数据进行整合处 理的系统 (57)摘要 本发明涉及文本数据整合技术领域, 且公开 了一种可对文本数据进行整合处理的系统, 包 括: 中央处理器; 源文件收纳系统, 用以接收并存 储所有文本评论数据; 打标签处理系统, 用以对 所有文本评论数据通过打标签的处理方式将已 有的数据进行打标签处理; 模型训练系统。 通过 设置打标签处理系统, 对源文件收纳系统中提取 出来的进行打印标签申请, 并加载预先配置数据 库标签, 若确定提取的数据中不存在待打印的文 本元素, 或者数据库中不存在与待打印的文本元 素的输出信息匹配的数据字段, 则从提取的数据 中, 获取与所述待打印的文本元素的输出信息对 应的目标脚本描述, 匹配后, 进行标签生成。 权利要求书2页 说明书6页 附图1页 CN 115237866 A 2022.10.25 CN 115237866 A 1.一种可对文本数据进行整合处 理的系统, 其特 征在于, 包括: 中央处理器; 源文件收纳系统, 用以接收并存 储所有文本评论数据; 打标签处理系统, 用以对所有文本评论数据通过打标签的处理方式将已有的数据进行 打标签处 理; 模型训练系统, 用以对处理后的数据作为训练数据集导入到语言表征模型中进行模型 训练, 并在经 过调优训练后产生特定的语言表征模型; 测试系统, 用测试数据集对语言表征模型进行检验, 在检验的过程中根据检验结果调 整模型训练参数; 整合系统, 用以对通过测试后的语言表征模型与程序系统进行整合, 得到最终想要结 果; 安全卫士系统, 用以对整个系统进行安全防护, 以防数据泄 露或者被盗; 登陆系统, 用以登陆并进入中央处 理器; 细粒度情感分析系统, 用以分析源文件中蕴含着的大量的用户反馈, 是情感分析的重 要组成部分, 能够描述 客户内心的感受。 2.根据权利要求1所述的一种可对文本数据进行整合处理 的系统, 其特征在于: 所述源 文件收纳系统包括收纳单元、 预处理单元和初步整合单元, 所述收纳系统包括文本数据接 收模块和存储模块, 所述文本数据接收模块的信号端与中央处理器的信号端双向信号连 接, 所述文本数据接 收模块的信号输出端与存储模块的信号输入端信号连接, 所述预处理 单元包括数据音频判断模块、 图像判断模块和文本判断模块, 所述存储模块的信号输出端 与预处理单元的信号输入端信号连接, 所述初步整合单元的信号输出端与预处理单元的信 号输出端信号连接, 所述源文件收纳系统的信号端与中央处 理器的信号端信号连接 。 3.根据权利要求1所述的一种可对文本数据进行整合处理 的系统, 其特征在于: 所述打 标签处理系统包括打印请求接收单元、 数据库标签加载单元、 数据库标签匹配单元、 标签生 成单元、 异常处理单元, 所述打印请求接 收单元的信号输入端与初步整合单元 的信号输出 端信号连接, 所述数据库标签加载单元的信号输入端与初步整合单元的信号输出端信号连 接, 所述数据库标签匹配单元 的信号输入端和打印请求接 收单元、 数据库标签加载单元 的 信号输出端信号连接, 所述标签生成单元的信号端与数据库标签匹配单元的信号端双向信 号连接, 所述异常处理单元 的信号端与数据库标签匹配单元、 标签生成单元 的信号端双向 信号连接, 所述打标签处 理系统的信号端与中央处 理器的信号端双向信号连接 。 4.根据权利要求1所述的一种可对文本数据进行整合处理 的系统, 其特征在于: 所述模 型训练系统包括特征匹配单元、 编码 器、 解码器和翻译 单元, 所述特征匹配单元的信号输入 端与标签生成单元的信号输出端信号连接, 所述特征匹配单元的信号输出端与编 码器的信 号输入端信号连接, 所述编码器的信号输出端与解码器的信号输入端信号连接, 所述解码 器的信号输出端与翻译单元的信号输入端信号连接, 所述模型训练系统的信号端与中央处 理器的信号端双向信号连接 。 5.根据权利要求1所述的一种可对文本数据进行整合处理 的系统, 其特征在于: 所述测 试系统包括数据集匹配单元和初始双向编 码器表征量模型单元, 所述数据集匹配单元的信 号输入端与翻译 单元的信号输出端信号连接, 所述数据集匹配单元的信号端和初始双向编权 利 要 求 书 1/2 页 2 CN 115237866 A 2码器表征量模型单元的信号端双向信号连接, 所述测试系统的信号端与中央处理器的信号 端双向信号连接 。 6.根据权利要求1所述的一种可对文本数据进行整合处理 的系统, 其特征在于: 所述整 合系统包括转化单元、 合并单元和处理单元, 所述整合系统的信号端与中央处理器的信号 端双向信号连接 。 7.根据权利要求1所述的一种可对文本数据进行整合处理 的系统, 其特征在于: 所述安 全卫士系统包括登陆单元、 杀毒软件单元和垃圾清理单元, 所述安全卫士系统的信号端与 中央处理器的信号端双向信号连接 。 8.根据权利要求1所述的一种可对文本数据进行整合处理 的系统, 其特征在于: 所述登 陆系统包括账号密码单元、 指纹识别单元, 人脸识别单元, 所述登陆系统的信号端与中央处 理器的信号端双向信号连接 。 9.根据权利要求1所述的一种可对文本数据进行整合处理 的系统, 其特征在于: 所述细 粒度情感分析系统包括: 观点类别分析单元、 情感分类单元、 联合学习 单元、 三元组联合抽 取单元, 所述细粒度情感分析系统的信号端与中央处 理器的信号端双向信号连接 。权 利 要 求 书 2/2 页 3 CN 115237866 A 3

PDF文档 专利 一种可对文本数据进行整合处理的系统

文档预览
中文文档 10 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种可对文本数据进行整合处理的系统 第 1 页 专利 一种可对文本数据进行整合处理的系统 第 2 页 专利 一种可对文本数据进行整合处理的系统 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:14:13上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。