公共安全标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210679144.9 (22)申请日 2022.06.16 (71)申请人 腾讯科技 (深圳) 有限公司 地址 518057 广东省深圳市南 山区高新区 科技中一路腾讯大厦3 5层 (72)发明人 赵文哲 林庆泓 蒋杰 郭春超  王红法 刘威  (74)专利代理 机构 华进联合专利商标代理有限 公司 44224 专利代理师 张思佳 (51)Int.Cl. G06F 16/22(2019.01) G06F 16/28(2019.01) G06F 16/2455(2019.01) G06K 9/62(2022.01) (54)发明名称 数据检索方法、 装置、 计算机设备和存储介 质 (57)摘要 本申请涉及一种数据检索方法、 装置、 计算 机设备、 计算机可读存储介质和计算机程序产 品。 所述方法包括: 获取目标数据的目标特征矩 阵, 并获取基于样本数据的样 本特征矩阵进行哈 希编码训练所得到的锚点间的相似度参数矩 阵 以及锚点与样本数据间的参数关系矩阵; 锚点为 样本数据的聚类中心; 按照相似度参数矩阵以及 锚点的锚点特征矩 阵与目标特征矩 阵间的核相 似度, 计算目标数据所匹配的目标相似矩阵; 基 于参数关系矩阵, 对目标相似矩阵进行分值计 算, 得到目标数据的目标分值矩阵; 根据目标分 值矩阵, 生成目标数据所匹配的目标哈希编码; 通过目标哈希编码进行数据检索, 确定目标数据 的检索结果。 采用本申请实施例方法能够提高数 据检索的性能。 权利要求书3页 说明书24页 附图8页 CN 115129713 A 2022.09.30 CN 115129713 A 1.一种数据检索方法, 其特 征在于, 所述方法包括: 获取目标数据的目标特征矩阵, 并获取基于样本数据的样本特征矩阵进行哈希编码训 练所得到的锚点间的相似度参数矩阵以及 锚点与样本数据间的参数关系矩阵; 所述锚点为 所述样本数据的聚类中心; 按照所述相似度参数矩阵以及所述锚点的锚点特征矩阵与所述目标特征矩阵间的核 相似度, 计算所述目标 数据所匹配的目标相似矩阵; 基于所述参数关系矩阵, 对所述目标相似矩阵进行分值计算, 得到所述目标数据的目 标分值矩阵; 根据所述目标分值矩阵, 生成所述目标 数据所匹配的目标哈希编码; 通过所述目标哈希编码进行 数据检索, 确定所述目标 数据的检索结果。 2.根据权利要求1所述的方法, 其特 征在于, 所述获取目标 数据的目标 特征矩阵, 包括: 对目标数据进行 特征提取处 理, 得到所述目标 数据的初始特 征矩阵; 对所述初始特 征矩阵进行正则化处 理, 获得所述目标 数据的目标 特征矩阵。 3.根据权利要求1所述的方法, 其特征在于, 所述按照所述相似度参数矩阵以及所述锚 点的锚点特征矩阵与所述目标特征矩阵间的核相似度, 计算所述目标数据所匹配的目标相 似矩阵, 包括: 通过高斯核函数, 计算所述锚点的锚点特征矩阵与所述目标特征矩阵间的高斯核相似 度, 获得所述锚点与所述目标 数据间的高斯核相似矩阵; 对所述高斯核相似矩阵和所述相似度参数矩阵进行矩阵乘积运算, 得到所述目标数据 所匹配的目标相似矩阵。 4.根据权利要求1所述的方法, 其特征在于, 所述基于所述参数关系矩阵, 对所述目标 相似矩阵进行分值计算, 得到所述目标 数据的目标分值矩阵, 包括: 基于所述参数关系矩阵, 对所述目标相似矩阵进行分值计算, 确定所述目标数据的初 始分值矩阵; 对所述初始分值矩阵中各分值向量的元素分别进行排序处理, 得到所述目标数据的目 标分值矩阵。 5.根据权利要求4所述的方法, 其特征在于, 所述根据所述目标分值矩阵, 生成所述目 标数据所匹配的目标哈希编码, 包括: 根据所述目标分值矩阵中的每一分值向量的位置, 将所述每一分值向量的数值与位于 所述分值向量之前的分值向量的数值进行 数值比较, 得到所述每一分值向量的比较结果; 基于所述每一分值向量的比较结果进行哈希编码赋值, 生成所述每一分值向量所对应 的哈希编码; 将所述每一分值向量的哈希编码按照分值向量顺序进行组合, 得到所述目标数据 所匹 配的目标哈希编码。 6.根据权利要求1至5中任一项所述的方法, 其特征在于, 所述通过所述目标哈希编码 进行数据检索, 确定所述目标 数据的检索结果, 包括: 根据所述目标哈希编码, 计算所述目标哈希编码与针对所述目标数据的各候选数据 所 对应的候选哈希编码之间的相似度, 得到相似度结果; 基于所述相似度结果, 从各所述候选哈希编码中, 筛选出满足相似度条件的相似 哈希权 利 要 求 书 1/3 页 2 CN 115129713 A 2编码; 将所述相似哈希编码所对应的候选数据作为所述目标 数据的检索结果。 7.根据权利要求1所述的方法, 其特 征在于, 所述方法还 包括: 通过高斯核函数, 计算所述锚点间的高斯核相似度, 得到所述锚点间的高斯核相似矩 阵; 对所述锚点间的高斯核相似矩阵所对应的逆矩阵进行矩阵分解处理, 获得所述锚点间 的相似度参数矩阵。 8.根据权利要求1所述的方法, 其特 征在于, 所述方法还 包括: 按照所述相似度参数矩阵以及所述锚点的锚点特征矩阵与所述样本特征矩阵间的核 相似度, 计算所述样本数据所匹配的样本相似矩阵; 根据所述样本相似矩阵进行矩阵分解处理, 得到所述锚点与 所述样本数据间的初始参 数关系矩阵; 基于所述样本相似矩阵和所述初始参数关系矩阵, 对所述样本特征所匹配的哈希编码 进行损失函数计算, 得到所述样本数据的哈希编码损失函数; 根据所述哈希编码损 失函数, 对所述初始参数关系矩阵进行数据更新, 得到所述锚点 与所述样本数据间的参数关系矩阵。 9.根据权利要求8所述的方法, 其特征在于, 所述根据所述样本相似矩阵进行矩阵分解 处理, 得到所述锚点与所述样本数据间的初始参数关系矩阵, 包括: 计算所述样本相似矩阵的转置与所述样本相似矩阵的乘积, 得到矩阵乘积结果; 对所述矩阵乘积结果进行矩阵分解处理, 得到所述锚点与所述样本数据间的初始参数 关系矩阵。 10.根据权利要求8所述的方法, 其特征在于, 所述根据所述哈希编码损失函数, 对所述 初始参数关系矩阵进行 数据更新, 得到所述锚点与所述样本数据间的参数关系矩阵, 包括: 以所述哈希编码损失函数的数值最小化作为目标, 将所述初始参数关系矩阵作为定 值, 对所述样本数据所匹配的哈希编码矩阵进行 更新, 得到更新编码矩阵; 将所述更新编码矩阵作为定值, 更新所述初始参数关系矩阵, 并在数据更新达到更新 结束条件时, 得到所述锚点与所述样本数据间的参数关系矩阵。 11.一种数据检索装置, 其特 征在于, 所述装置包括: 数据获取模块, 用于获取目标数据的目标特征矩阵, 并获取基于样本数据的样本特征 矩阵进行哈希编码训练所得到的锚点间的相似度参数矩阵以及锚点与样本数据间的参数 关系矩阵; 所述锚点 为所述样本数据的聚类中心; 相似计算模块, 用于按照所述相似度参数矩阵以及所述锚点的锚点特征矩阵与所述目 标特征矩阵间的核相似度, 计算所述目标 数据所匹配的目标相似矩阵; 分值计算模块, 用于基于所述参数关系矩阵, 对所述目标相似矩阵进行分值计算, 得到 所述目标 数据的目标分值矩阵; 数据编码模块, 用于根据所述目标分值矩阵, 生成所述目标数据所匹配的目标哈希编 码; 结果确定模块, 用于通过所述目标哈希编码进行数据检索, 确定所述目标数据的检索 结果。权 利 要 求 书 2/3 页 3 CN 115129713 A 3

.PDF文档 专利 数据检索方法、装置、计算机设备和存储介质

文档预览
中文文档 36 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共36页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 数据检索方法、装置、计算机设备和存储介质 第 1 页 专利 数据检索方法、装置、计算机设备和存储介质 第 2 页 专利 数据检索方法、装置、计算机设备和存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 00:15:17上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。