(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211027366.9
(22)申请日 2022.08.25
(71)申请人 深圳前海环融联易信息科技 服务有
限公司
地址 518000 广东省深圳市前海深港合作
区前湾一路1号A栋201室(入驻深圳市
前海商务秘书 有限公司)
(72)发明人 黄再广 张梓霖 王国鹏
(74)专利代理 机构 深圳众鼎汇成知识产权代理
有限公司 4 4566
专利代理师 朱业刚
(51)Int.Cl.
G06V 30/10(2022.01)
G06V 30/19(2022.01)
G06V 30/41(2022.01)G06F 40/30(2020.01)
(54)发明名称
键值文件处理方法、 装置、 设备、 介质和计算
机程序产品
(57)摘要
本发明公开了一种键值文件处理方法、 装
置、 设备、 介质和计算机程序产品, 其中, 方法包
括: 获取与待识别文件具有相同版式的标准键值
文件, 并获取标准键值文件的图特征; 采用文本
识别模型对待识别文件进行文本识别, 得到待识
别文件的多个识别键和多个识别值; 对待识别文
件中多个识别值的位置进行区域构图, 得到待识
别文件的识别值关系图, 并基于识别值关系图进
行图特征提取, 得到待识别文件的图特征; 根据
标准键值文件的图特征和待识别文件的图特征,
求解得到 各识别值的与识别键的对应 关系, 并基
于各识别值的与识别键的对应关系生成目标键
值文档; 本发明提高了键 ‑值数据的识别准确性,
从而提高了数据处 理效果。
权利要求书3页 说明书16页 附图4页
CN 115116060 A
2022.09.27
CN 115116060 A
1.一种键值文件处 理方法, 其特 征在于, 包括:
获取与待识别文件具有相同版式的标准键值文件, 并获取所述标准键值文件的图特
征, 所述标准键值文件的图特征为对所述标准键值文件的标准值关系图进 行特征提取得到
的图特征;
采用文本识别模型对所述待识别文件进行文本识别, 得到所述待识别文件的多个识别
键和多个识别值;
对所述待识别文件中多个所述识别值的位置进行区域构图, 得到所述待识别文件的识
别值关系图, 并基于所述识别值关系图进行图特 征提取, 得到所述待识别文件的图特 征;
根据所述标准键值文件的图特征和所述待识别文件的图特征, 求解得到各所述识别值
的与所述识别键的对应关系, 并基于各所述识别值的与所述识别键的对应关系生成目标键
值文档。
2.如权利要求1所述的键值文件处理方法, 其特征在于, 所述图特征包括节点特征和边
特征, 所述根据所述标准键值文件的图特征和所述待识别文件的图特征, 求解得到各所述
识别值的与所述识别键的对应关系, 包括:
对所述待识别文件的多个节点特征和所述标准键值文件的多个节点特征进行相似度
计算, 得到节点相似度矩阵;
对所述待识别文件的多个边特征和所述标准键值文件的多个边特征进行相似度计算,
得到边相似度矩阵;
将所述节点相似度矩阵、 所述边相似度矩阵输入预设求解器进行求解, 得到所述待识
别文件相对所述标准键值文件的置换矩阵;
基于所述标准键值文件的版式对所述置换矩阵进行解析, 得到所述待识别文件中各所
述识别值的与所述识别键的对应关系。
3.如权利要求2所述的键值文件处理方法, 其特征在于, 每一所述节点特征包括语义特
征、 视觉特征、 空间特征和形状特征, 所述对所述待识别文件的多个节点特征和所述标准键
值文件的多个节点特 征进行相似度计算, 得到节点相似度矩阵, 包括:
对所述待识别文件的每一语义特征分别和所述标准键值文件的每一语义特征进行相
似度计算, 得到多个 语义相似度;
对所述待识别文件的每一视觉特征分别和所述标准键值文件的每一视觉特征进行相
似度计算, 得到多个视 觉相似度;
对所述待识别文件的每一空间特征分别和所述标准键值文件的每一空间特征进行相
似度计算, 得到多个空间相似度;
对所述待识别文件的每一形状特征分别和所述标准键值文件的每一形状特征进行相
似度计算, 得到多个形状相似度;
对同一所述节点特征对应的所述语义相似度、 所述视觉相似度、 所述空间相似度和所
述形状相似度进行平均处理, 将得到的相似度平均值作为所述节点特征 的节点相似度, 得
到多个所述节点特征的节点相似度, 并将所述多个所述节点特征的节点相似度生成为所述
节点相似度矩阵。
4.如权利要求2所述的键值文件处理方法, 其特征在于, 每一所述边特征包括方向特征
和形态特征, 所述对所述待识别文件多个边特征和所述标准键值文件的多个边特征进 行相权 利 要 求 书 1/3 页
2
CN 115116060 A
2似度计算, 得到边相似度矩阵, 包括:
对所述待识别文件的每一方向特征分别和所述标准键值文件的每一方向特征进行相
似度计算, 得到多个方向相似度;
对所述待识别文件的每一形态特征分别和所述标准键值文件的每一形态特征进行相
似度计算, 得到多个形态相似度;
对同一所述边特征对应的所述方向相似度和所述形态相似度进行平均处理, 将得到的
相似度平均值作为所述边特征 的边相似度, 得到多个所述边特征 的边相似度, 并将所述多
个所述边特征的边相似度生成为所述 边相似度矩阵。
5.如权利要求1所述的键值文件处理方法, 其特征在于, 所述对所述待识别文件中多个
所述识别值的位置进行区域构图, 得到所述待识别文件的识别值关系图, 包括:
将所述识别值所在区域记为动态区域, 得到多个所述动态区域;
以每一所述动态区域为原点发射多条射线, 将所述射线触及到的所述动态区域依次连
接得到闭环图, 记为所述待识别文件的初始图;
将所述初始图中两两所述动态区域的距离作为权重, 采用普利姆算法在所述初始图中
搜索最小生成树, 并将所述 最小生成树作为所述识别值关系图。
6.如权利要求1所述的键值文件处理方法, 其特征在于, 所述基于所述识别值关系图进
行图特征提取, 得到所述待识别文件的图特 征, 包括:
确定所述识别值关系图中的多个动态区域, 每一所述动态区域表示为每一所述识别值
的所在区域;
对所述识别值关系图中相邻两所述动态区域的连接边进行特征提取, 得到多个边特
征;
对各所述动态区域进行节点特征提取, 得到多个节点特征, 每一所述节点特征至少包
括语义特 征和视觉特征;
将多个所述节点特 征和多个所述 边特征作为所述待识别文件的图特 征。
7.如权利要求6所述的键值文件处理方法, 其特征在于, 所述对所述识别值关系图中相
邻两所述动态区域的连接边进行 特征提取, 得到多个边特 征, 包括:
将所述连接边两端的所述动态区域, 记为所述连接边上相邻的两所述动态区域;
将所述连接边上相邻两所述动态区域的相对位置, 记为所述连接边的方向特 征;
将所述连接边上相邻 两所述动态区域的高度和宽度进行拼接, 得到所述连接边的形态
特征;
遍历所有所述连接边, 直至得到所有所述连接边的所述方向特 征和所述形态特 征。
8.如权利要求6所述的键值文件处理方法, 其特征在于, 所述对各所述动态区域进行节
点特征提取, 得到多个所述节点特 征, 包括:
将各所述动态区域进行裁剪得到动态区域图像, 并分别将各所述动态区域图像输入视
觉提取层进行视 觉特征提取, 得到各 所述动态区域的视 觉特征;
将各所述识别值分别 输入语义提取模型中进行语义特征提取, 得到各所述动态区域的
语义特征;
将所述动态区域的高度和宽度作为所述动态区域的形状特征, 得到各所述动态区域的
形状特征;权 利 要 求 书 2/3 页
3
CN 115116060 A
3
专利 键值文件处理方法、装置、设备、介质和计算机程序产品
文档预览
中文文档
24 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共24页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-03-03 12:14:03上传分享