公共安全标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210994247.4 (22)申请日 2022.08.18 (71)申请人 珠海市测绘院 地址 519000 广东省珠海市香洲区吉大白 莲路12号 申请人 北京山维科技股份有限公司   上海刻羽信息科技有限公司 (72)发明人 李旺民 曾仕声 丁建勋 黎彬  高春辉 贠法长 李自然 杜阳  刘亚楠  (74)专利代理 机构 广州三环 专利商标代理有限 公司 44202 专利代理师 卢泽明 (51)Int.Cl. G06F 16/31(2019.01)G06F 16/35(2019.01) G06F 40/151(2020.01) G06F 40/253(2020.01) G06F 40/30(2020.01) (54)发明名称 一种非结构化测绘报告数据解析方法及系 统 (57)摘要 本发明涉及一种非结构化测绘报告数据解 析方法及系统, 包括: S1.预解析分类处理: 对非 结构化测绘数据进行预解析分类; S2.数据解析 处理: 根据映射关系对预解析分类得到的分类数 据进行数据解析, 得到中间数据和二进制格式原 始文件; S3.结构化转换处理: 将数据解析得到的 中间数据和二进制格式原始文件作为数据源, 调 用相应的结构化表模板和映射关系, 转换输出组 织结构化测绘数据。 本方法通过利用映射关系对 非结构化历史测绘数据的锁定关键信息解析区 域进行解析、 完成非结构化测绘数据信息的最大 化提取, 实现结构化测绘报告数据转换, 显著提 升数据提取 组织的自动化能力, 提高信息整理水 平, 进而提升了测绘单位数据产品共享服务的质 量。 权利要求书2页 说明书6页 附图1页 CN 115495544 A 2022.12.20 CN 115495544 A 1.一种非结构化测绘报告数据解析 方法, 其特 征在于, 包括: S1.预解析分类处 理: 对非结构化测绘数据进行 预解析分类; S2.数据解析处理: 根据映射关系对预解析分类得到的分类数据进行数据解析, 得到 中 间数据和二进制格式原 始文件; S3.结构化转换处理: 将数据解析得到的中间数据和二进制格 式原始文件作为数据源, 调用相应的结构化表模板和映射关系, 转换输出组织结构化测绘数据。 2.根据权利要求1所述的非结构化测绘报告数据解析方法, 其特征在于, 还包括在预解 析分类处理之前, 进 行映射关系建立, 所述映射关系建立具体为: 提取各类测绘业务的成果 共享资源 池中关键信息, 建立结构映射和语义映射。 3.根据权利要求3所述的非结构化测绘报告数据解析方法, 其特征在于, 所述建立结构 映射和语义映射, 具体为: 通过利用基于Grok语法 的规则表达式开发的历史测绘报告信息 映射技术对提取的非结构、 不连续、 单元离散的关键信息进 行匹配重组, 得到结构映射关系 和语义映射关系。 4.根据权利要求1或2或3所述的非结构化测绘报告数据解析方法, 其特征在于, 所述预 解析分类处 理包括: 获取原始非结构化测绘数据; 分析该原始非结构化测绘数据, 并根据测绘报告业 务类型进行解析 预分类。 5.根据权利要求4所述的非结构化测绘报告数据解析方法, 其特征在于, 所述分析该原 始非结构化测绘数据, 并根据测绘报告业务类型进 行解析预分类, 具体为: 根据测绘报告业 务类型选用相应的非结构化数据模板元, 并根据该非结构化数据模板元对原始非结构化测 绘数据进行比对, 锁定关键信息解析区域, 并将非锁定区域的数据进行 预分类处 理。 6.根据权利要求5所述的非结构化测绘报告数据解析方法, 其特征在于, 所述根据 该非 结构化数据模板元对原始非结构化测绘数据进行比对, 锁定信息解析区域, 具体为: 基于元 数据的模板匹配机制, 对原始非结构化测绘数据正反比较差异化, 得到非结构化测绘数据 的锁定关键信息解析区域。 7.根据权利要求1或2或3或5或6所述的非结构化测绘报告数据解析方法, 其特征在于, 所述数据解析处 理, 具体包括: 根据分类规则从解析库中选取相应的映射关系; 在解析过程中, 从选取的映射关系中根据对预解析分类得到的分类数据动态触发映射 关系进行 数据解析; 在解析完毕后生成Jso n中间数据以及二进制格式原 始文件。 8.根据权利要求1或2或3或5或6所述的非结构化测绘报告数据解析方法, 其特征在于, 在结构化转换 处理并转换输出组织结构化的测绘数据后, 根据独立模板元对转换输出组织 结构化测绘数据进行冗余分析, 确保组织结构化测绘数据的正确性。 9.根据权利要求1或2或3或5或6所述的非结构化测绘报告数据解析方法, 其特征在于, 在预解析分类处理之前, 建立非结构化数据模板元, 该非结构化数据模板元不包含提取信 息的原始结构数据, 用于数据解析 过程中对偏离模板的内容进行识别并单独处 理。 10.一种基于权利要求1 ‑9所述的非结构化测绘报告数据解析方法的系统, 其特征在 于, 包括:权 利 要 求 书 1/2 页 2 CN 115495544 A 2预解析分类模块(10 0), 用于对非结构化测绘数据进行 预解析分类; 数据解析处理模块(200), 用于根据映射关系对预解析分类得到的分类数据进行数据 解析, 得到中间数据和二进制格式原 始文件; 以及, 结构化转换处理模块(300), 用于将数据解析得到的中间数据和二进制格式原始 文件作为数据源, 调用相应的结构化表模板和映射关系, 转换输出组织结构化的测绘数据。权 利 要 求 书 2/2 页 3 CN 115495544 A 3

PDF文档 专利 一种非结构化测绘报告数据解析方法及系统

文档预览
中文文档 10 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种非结构化测绘报告数据解析方法及系统 第 1 页 专利 一种非结构化测绘报告数据解析方法及系统 第 2 页 专利 一种非结构化测绘报告数据解析方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:14:08上传分享
友情链接
交流群
  • //public.wenku.github5.com/wodemyapi/22.png
-->
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。