公共安全标准网
文库搜索
切换导航
文件分类
频道
联系我们
问题反馈
文件分类
联系我们
问题反馈
批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210068520.0 (22)申请日 2022.01.20 (66)本国优先权数据 202110789955.X 2021.07.13 CN (71)申请人 北京金山数字 娱乐科技有限公司 地址 100085 北京市海淀区西二 旗中路33 号院5号楼1 1层002号 (72)发明人 白金国 李长亮 (74)专利代理 机构 北京智信禾专利代理有限公 司 11637 代理人 刘晓楠 (51)Int.Cl. G06F 16/33(2019.01) G06F 16/34(2019.01) G06F 16/35(2019.01)G06F 40/30(2020.01) (54)发明名称 关键词匹配方法、 装置、 计算设备及计算机 可读存储介质 (57)摘要 本申请提供关键词匹配方法、 装置、 设备及 存储介质, 其中, 所述关键词匹配方法, 包括: 获 取目标文本; 对 所述目标文本进行逐字符的关键 词匹配, 得到多个候选关键词; 对所述多个候选 关键词进行匹配, 确定存在关联关系的候选关键 词作为所述目标文本的目标关键词。 本方案可以 提高关键词匹配的准确度。 权利要求书3页 说明书12页 附图5页 CN 114416926 A 2022.04.29 CN 114416926 A 1.一种关键词匹配方法, 其特 征在于, 所述方法包括: 获取目标文本; 对所述目标文本进行 逐字符的关键词匹配, 得到多个候选关键词; 对所述多个候选关键词进行匹配, 确定存在 关联关系的候选关键词作为所述目标文本 的目标关键词。 2.根据权利要求1所述的方法, 其特征在于, 所述对所述多个候选关键词进行匹配, 确 定存在关联关系的候选关键词作为所述目标文本的目标关键词, 包括: 从所述多个候选关键词中, 确定与词级别库中属于同一关联关系的各词语匹配的候选 关键词; 其中, 所述词级别库存 储多个词语, 以及各词语之间的关联关系; 将匹配的候选关键词作为所述目标文本的目标关键词。 3.根据权利要求1所述的方法, 其特征在于, 所述对所述多个候选关键词进行匹配, 确 定存在关联关系的候选关键词作为所述目标文本的目标关键词, 包括: 获取所述多个候选关键词之间的关联度; 对所述关联度 大于或者等于关联度阈值的多个候选关键词进行匹配, 确定存在 关联关 系的候选关键词为所述目标文本的目标关键词。 4.根据权利要求3所述的方法, 其特征在于, 所述获取所述多个候选关键词之间的关联 度, 包括: 获取所述多个候选关键词在所述目标文本中的位置; 利用各候选关键词的所述位置, 确定各候选关键词在所述目标文本中的间隔距离, 作 为所述关联度。 5.根据权利要求1所述的方法, 其特征在于, 所述对所述目标文本进行逐字符的关键词 匹配, 得到多个候选关键词, 包括: 将所述目标文本的各字符依次与字符级别库进行匹配, 得到多个候选关键词; 其中, 所述字符级别库中的字符属于预设 关键词。 6.根据权利要求1所述的方法, 其特征在于, 在所述对所述多个候选关键词进行匹配, 确定存在关联关系的候选关键词作为所述目标文本的目标关键词之后, 所述方法还 包括: 将所述目标关键词输入预先训练得到的分类模型, 得到所述目标文本的类型; 其中, 所 述分类模型为利用样本关键词以及所述样本关键词对应的样本文本的类型标签训练得到 的神经网络模型; 输出所述类型。 7.根据权利要求1所述的方法, 其特征在于, 在所述对所述多个候选关键词进行匹配, 确定存在关联关系的候选关键词作为所述目标文本的目标关键词之后, 所述方法还 包括: 利用所述目标关键词, 生成所述目标文本的内容摘要; 输出所述内容摘要。 8.根据权利要求1所述的方法, 其特 征在于, 所述获取目标文本, 包括: 获取待匹配的文件, 并确定所述文件的文件类型; 当所述文件类型为文本文档时, 将所述文件确定为目标文本, 否则, 将所述文件转换为 文本文档, 并将转换后的文本文档确定为目标文本 。 9.一种关键词匹配装置, 其特 征在于, 所述装置包括:权 利 要 求 书 1/3 页 2 CN 114416926 A 2文本获取模块, 被 配置为获取目标文本; 单关键词 匹配模块, 被配置为对所述目标文本进行逐字符的关键词 匹配, 得到多个候 选关键词; 多关键词 匹配模块, 被配置为对所述多个候选关键词进行匹配, 确定存在关联关系的 候选关键词作为所述目标文本的目标关键词。 10.根据权利要求9所述的装置, 其特征在于, 所述多关键词匹配模块, 进一步被配置 为: 从所述多个候选关键词中, 确定与词级别库中属于同一关联关系的各词语匹配的候选 关键词; 其中, 所述词级别库存 储多个词语, 以及各词语之间的所述关联关系; 将匹配的候选关键词作为所述目标文本的目标关键词。 11.根据权利要求9所述的装置, 其特征在于, 所述多关键词匹配模块, 进一步被配置 为: 获取所述多个候选关键词之间的关联度; 对所述关联度 大于或者等于关联度阈值的多个候选关键词进行匹配, 确定存在 关联关 系的候选关键词作为所述目标文本的目标关键词。 12.根据权利要求11所述的装置, 其特征在于, 所述多关键词 匹配模块, 进一步被配置 为: 获取所述多个候选关键词在所述目标文本中的位置; 利用各候选关键词的所述位置, 确定各候选关键词在所述目标文本中的间隔距离, 作 为所述关联度。 13.根据权利要求9所述的装置, 其特征在于, 所述单关键词匹配模块, 进一步被配置 为: 将所述目标文本的各字符依次与字符级别库进行匹配, 得到多个候选关键词; 其中, 所述字符级别库中的字符属于预设 关键词。 14.根据权利要求9所述的装置, 其特 征在于, 所述装置还 包括输出模块, 被 配置为: 在所述对所述多个候选关键词进行匹配, 确定存在 关联关系的候选关键词作为所述目 标文本的目标关键词之后, 将所述 目标关键词输入预先训练得到的分类模型, 得到所述 目 标文本的类型; 其中, 所述分类模型为利用样本关键词以及所述样本关键词对应的样本文 本的类型 标签训练得到的神经网络模型; 输出所述类型。 15.根据权利要求9所述的装置, 其特 征在于, 所述装置还 包括输出模块, 被 配置为: 在所述对所述多个候选关键词进行匹配, 确定存在 关联关系的候选关键词作为所述目 标文本的目标关键词之后, 利用所述目标关键词, 生成所述目标文本的内容摘要; 输出所述内容摘要。 16.根据权利要求9所述的装置, 其特 征在于, 所述文本获取模块, 进一 步被配置为: 获取待匹配的文件, 并确定所述文件的文件类型; 当所述文件类型为文本文档时, 将所述文件确定为目标文本, 否则, 将所述文件转换为 文本文档, 并将转换后的文本文档确定为目标文本 。 17.一种计算设备, 其特 征在于, 包括:权 利 要 求 书 2/3 页 3 CN 114416926 A 3
专利 关键词匹配方法、装置、计算设备及计算机可读存储介质
文档预览
中文文档
21 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助2元下载(无需注册)
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2元下载
本文档由 SC 于
2024-02-18 22:33:49
上传分享
举报
下载
原文档
(556.8 KB)
分享
友情链接
GB-T 36630.1-2018 信息安全技术 信息技术产品安全可控评价指标 第1部分:总则.pdf
GB-T 567.4-2012 爆破片安全装置 第4部分:型式试验.pdf
GB-T 37090-2018 信息安全技术 病毒防治产品安全技术要求和测试评价方法.pdf
GB-T 36403-2018 红外光学玻璃红外透过率测试方法 傅里叶变换法.pdf
T-WX 0002—2017 移动终端数字证书应用标准- 术语标识规范.pdf
GB-T 26006-2010 船用铝合金挤压管、棒、型材.pdf
GB-T 19590-2023 纳米碳酸钙.pdf
清华大学自动化系:2023预训练大模型与医疗:从算法研究到应用.pdf
GB-T 23561.9-2009 煤和岩石物理力学性质测定方法 第9部分:煤和岩石三轴强度及变形参数测定方法.pdf
GB-T 38249-2019 信息安全技术 政府网站云计算服务安全指南.pdf
T-CI 126—2023 高寒草地碳储量及碳汇核算技术导则.pdf
GB-T 15909-2017 电子工业用气体 硅烷.pdf
GB-T 21063.6-2007 政务信息资源目录体系 第6部分 技术管理要求.pdf
GB-T 42589-2023 信息安全技术 电子凭据服务安全规范.pdf
GB-T 30677-2014 轻型汽车电子稳定性控制系统性能要求及试验方法.pdf
T-JSJXXH 008—2022 一般用变频无油螺杆鼓风机.pdf
GB-T 39989-2021 超弹性钛镍形状记忆合金棒材和丝材.pdf
GB-T 271-2017 滚动轴承 分类.pdf
GB-T 3795-2014 锰铁.pdf
T-WAPIA 045.3—2021 信息技术 系统间远程通信和信息交换 原子密钥建立与实体鉴别 第3部分:采用证书的原子密钥建立与实体鉴别.pdf
交流群
-->
1
/
21
评价文档
赞助2元 点击下载(556.8 KB)
回到顶部
×
微信扫码支付
2
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。