公共安全标准网
文库搜索
切换导航
文件分类
频道
联系我们
问题反馈
文件分类
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210089691.1 (22)申请日 2022.01.25 (71)申请人 鹏城实验室 地址 518000 广东省深圳市南 山区兴科一 街2号 (72)发明人 程正涛 张伟哲 束建钢 杨帆 邹庆胜 (74)专利代理 机构 深圳市世纪恒程知识产权代 理事务所 4 4287 专利代理师 赵燕燕 (51)Int.Cl. G06F 21/62(2013.01) G06F 21/60(2013.01) G06F 16/36(2019.01) G06F 16/31(2019.01)G06F 40/30(2020.01) G06F 16/901(2019.01) (54)发明名称 跨模态隐私语义表征方法、 装置、 设备及存 储介质 (57)摘要 本发明公开了一种跨模态隐私语义表征方 法、 装置、 设备及存储介质, 涉及数据处理技术领 域, 方法包括: 获取多模态数据; 根据多模态数 据, 获得对应的文本数据; 对文本数据进行关键 词提取和加密, 得到密态关键词; 根据密态关键 词, 对预设知识图谱进行分割, 得到密态子图; 对 密态子图进行图嵌入, 得到与密 态关键词对应的 密态表征向量, 以得到多模态数据的语义表征结 果。 本发明解决了现有技术中存在密态关键词之 间的语义关联性较差的问题, 实现了不仅可以保 证密态关键词之间的语义关联, 还 可以为后续进 行隐私语义的检索提供准确的语义表征的效果。 权利要求书2页 说明书14页 附图3页 CN 114528588 A 2022.05.24 CN 114528588 A 1.一种跨模态隐私语义表征 方法, 其特 征在于, 所述方法包括: 获取多模态数据; 根据所述多模态数据, 获得对应的文本数据; 对所述文本数据进行关键词提取和 加密, 得到密态关键词; 根据所述密态关键词, 对所述预设知识图谱进行分割, 得到密态子图; 对所述密态子 图进行图嵌入, 得到与所述密态关键词对应的密态表征向量, 以得到所 述多模态数据的语义表征 结果。 2.如权利要求1所述的跨模态隐私语义表征方法, 其特征在于, 所述多模态数据包括至 少两种不同模态的数据信息; 所述根据所述多模态数据, 获得对应的文本数据的步骤 包括: 当所述多模态数据包括语音模态的第一模态数据时, 利用语音识别技术, 将所述第一 模态数据转换为第一文本数据; 当所述多模态数据包括视频模态的第二模态数据时, 利用训练好的文本生成模型, 将 所述第二模态数据转换为第二文本数据; 当所述多模态数据包括文本模态的第 三模态数据时, 直接将所述第 三模态数据确定为 第三文本数据。 3.如权利要求2所述的跨模态隐私语义表征方法, 其特征在于, 所述对所述文本数据进 行关键词提取和 加密, 得到密态关键词的步骤 包括: 对所述第 一文本数据、 第 二文本数据和/或第 三文本数据进行关键词提取和加密, 得到 密态关键词。 4.如权利要求1所述的跨模态隐私语义表征方法, 其特征在于, 所述对所述文本数据进 行关键词提取和 加密, 得到密态关键词的步骤 包括: 通过无监督学习算法对所述文本数据进行关键词提取, 得到关键词; 通过对称加密算法对所述关键词进行加密处 理, 得到密态关键词。 5.如权利要求4所述的跨模态隐私语义表征方法, 其特征在于, 所述通过无监督学习算 法对所述文本数据进行关键词提取, 得到关键词的步骤 包括: 对所述文本数据进行分词处 理, 得到多个词汇; 根据所述多个词汇, 绘制词汇网络图; 其中, 所述词 汇网络图的网络节点对应于所述词 汇, 连接两个网络节点的边具有属性 值, 所述属性 值根据所述多个词汇的共现关系确定; 根据所述词汇网络 图, 对所述多个词汇进行排序和筛选, 得到表征所述文本数据的关 键词。 6.如权利要求1所述的跨模态隐私语义表征方法, 其特征在于, 所述根据 所述密态关键 词, 对所述预设知识图谱进行分割, 得到密态子图的步骤之前, 所述方法还 包括: 通过开源知识图谱确定一基础 知识图谱; 对所述基础知识图谱进行加密处理, 得到预设知识图谱; 其中, 所述加密处理采用的加 密算法与所述对所述文本数据进行加密时采用的加密算法一 致。 7.如权利要求1所述的跨模态隐私语义表征方法, 其特征在于, 所述根据 所述密态关键 词, 对所述预设知识图谱进行分割, 得到密态子图的步骤 包括: 根据所述密态关键词, 在所述预设知识图谱中匹配与所述密态关键词对应的实体, 获权 利 要 求 书 1/2 页 2 CN 114528588 A 2得知识节点; 在所述预设知识图谱中, 以所述知识节点为中心, 根据预设裁剪距离进行分割, 得到密 态子图; 其中, 所述预设裁剪距离的长度单位为两个实体之间的边, 所述密态子图为以所述 知识节点为中心的预设裁 剪距离范围内的实体与边的集 合。 8.一种跨模态隐私语义表征装置, 其特 征在于, 所述装置包括: 数据获取模块, 用于获取多模态数据; 文本描述模块, 用于根据所述多模态数据, 获得对应的文本数据; 关键词提取模块, 用于对所述文本数据进行关键词提取和 加密, 得到密态关键词; 图谱分割模块, 用于根据 所述密态关键词, 对所述预设知识图谱进行分割, 得到密态子 图; 图嵌入模块, 用于对所述密态子 图进行图嵌入, 得到与所述密态关键词对应的密态表 征向量, 以得到所述多模态数据的语义表征 结果。 9.一种跨模态隐私语义表征设备, 其特征在于, 所述跨模态隐私语义表征设备包括存 储器和处理器, 所述存储器上存储有跨模态隐私语义表征程序, 该跨模态隐私语义表征程 序被所述处 理器执行时, 实现如权利要求1至7中任一项所述的跨模态隐私语义表征 方法。 10.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 所述计算机程序 可被一个或多个处理器执行, 以实现如权利要求 1至7中任一项 所述的跨模态隐私 语义表征 方法。权 利 要 求 书 2/2 页 3 CN 114528588 A 3
专利 跨模态隐私语义表征方法、装置、设备及存储介质
文档预览
中文文档
20 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助2元下载(无需注册)
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2元下载
本文档由 SC 于
2024-02-18 22:33:45
上传分享
举报
下载
原文档
(692.5 KB)
分享
友情链接
T-CTS 14—2023 城市道路交通安全风险隐患数字化排查指标体系.pdf
GB-T 36072-2018 活动断层探测.pdf
DB37-T 4646.3—2023 公共数据 数据治理规范 第3部分:数据返还 山东省.pdf
GB-T 37956-2019 信息安全技术 网站安全云防护平台技术要求.pdf
GB/T 40209-2021 制造装备集成信息模型通用建模规则.pdf
GB-T 23938-2021 高纯二氧化碳.pdf
DB14-T 2841-2023 政务云平台 运维规范 山西省.pdf
GB-T 42888-2023 信息安全技术 机器学习算法安全评估规范.pdf
专利 一种用于冲压模的插入式组合散热装置.PDF
DL-T 2036-2019 高压交流架空输电线路可听噪声计算方法.pdf
GB-T 29119-2023 煤层气资源勘查技术规范.pdf
T-CSEE 0087.2—2018 电力量子保密通信系统 第2部分:VPN网关设备.pdf
DB36-T 1346-2020 节能评估技术导则 中药制剂 江西省.pdf
GB-T 15317-2009 燃煤工业锅炉节能监测.pdf
SL-T 247-2020 水文资料整编规范.pdf
GB-T 7932-2017 气动 对系统及其元件的一般规则和安全要求.pdf
HB 8574-2020 民用飞机机载嵌入式操作系统应用集成验证要求.pdf
T-SSACE 019—2023 热处理带肋高强钢筋 T63-E-G 混凝土应用技术规程.pdf
CCSP Exam Guide AIO 第2版 英文版.pdf
GB-T 26471-2023 塔式起重机 安装、拆卸与爬升规则.pdf
交流群
-->
1
/
20
评价文档
赞助2元 点击下载(692.5 KB)
回到顶部
×
微信扫码支付
2
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。