公共安全标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211060094.2 (22)申请日 2022.08.31 (71)申请人 南京擎盾信息科技有限公司 地址 210000 江苏省南京市雨 花台区安德 门大街21号江苏科技金融大厦2号楼2 层 (72)发明人 王加伟 杜向阳  (74)专利代理 机构 北京知果之信知识产权代理 有限公司 1 1541 专利代理师 苏利 (51)Int.Cl. G06F 40/103(2020.01) G06F 40/279(2020.01) G06F 40/30(2020.01) (54)发明名称 一种槽位标签的生成方法、 装置及存 储介质 (57)摘要 本申请实施例公开了一种槽位标签的生成 方法、 装置及存储介质, 其中槽位标签的生成方 法包括步骤: 获取包含初始槽位的文档文件, 所 述文档文件的类型包括DOC X文档格式、 图片格式 和/或PDF文档格式; 获取所述文档文件的初始 槽 位前后文信息, 利用基于预训练语 言模型的提示 学习方法, 根据所述初始槽位前后文信息, 在所 述初始槽位处生成对应的提示掩码; 根据所述提 示掩码, 利用所述预训练语言模型, 预测 并生成 所述槽位标签。 通过上述方法, 可 以同时考虑槽 位的前后文语义信息来生 成槽位标签, 使生成的 槽位标签更加准确。 权利要求书2页 说明书10页 附图7页 CN 115358186 A 2022.11.18 CN 115358186 A 1.一种槽位标签的生成方法, 其特 征在于, 包括以下步骤: 获取包含初始槽位的文档文件, 所述文档文件的类型包括DOCX文档格式、 图片格式和/ 或PDF文档格式; 获取所述文档文件的初始槽位前后文信息, 利用基于预训练语言模型的提示学习方 法, 根据所述初始槽位前后文信息, 在所述初始槽位处生成对应的提 示掩码; 根据所述 提示掩码, 利用所述预训练语言模型, 预测并生成所述槽位标签。 2.根据权利要求1所述的槽位标签的生成方法, 其特征在于, 在所述初始槽位处生成对 应的所述 提示掩码的方法还 包括: 将所述文档文件的所述初始槽位调整为目标槽位, 所述目标槽位处生成有所述提示掩 码。 3.根据权利要求1所述的槽位标签的生成方法, 其特征在于, 预测并生成所述槽位标签 的方法包括: 利用所述预训练语言模型, 进行掩码预测任务, 分别预测出每个所述提示掩码对应的 真实文字, 然后组合所述 提示掩码处的各 单个所述真实文字, 形成完整的所述槽位标签。 4.根据权利要求1所述的槽位标签的生成方法, 其特征在于, 在所述初始槽位处生成对 应的所述 提示掩码的方法还 包括: 构建提示模板, 用以提示所述预训练语言模型的学习目标是预测被所述提示模板标记 处的所述槽位标签。 5.根据权利要求1所述的槽位标签的生成方法, 其特 征在于, 还 包括: 基于数据集分析, 选定所述槽位标签的最长长度, 如果所述槽位标签的长度小于所述 最长长度, 则使用所述提示掩码对所述预训练语言模型 的输入部分进行遮蔽, 对输出 的所 述槽位标签使用结束标识进行填充。 6.根据权利要求1所述的槽位标签的生成方法, 其特 征在于, 还 包括: 基于所述初始槽位对应的所述槽位标签, 获取所述槽位标签对应的填写内容, 将所述 所述填写内容还原到所述文档文件的对应位置 。 7.根据权利要求6所述的槽位标签的生成方法, 其特征在于, 获取所述槽位标签对应的 所述填写内容的方法包括: 将所述初始槽位和对应的所述槽位标签整合为表单, 将所述表单发送给用户, 获取所 述用户输入的信息, 得到所述槽位标签对应的所述 填写内容。 8.根据权利要求6所述的槽位标签的生成方法, 其特征在于, 将所述槽位对应的所述填 写内容还原到所述文档文件中的方法包括: 对于DOCX文档格 式的所述文档文件, 直接将所述填写内容替换对应的所述初始槽位的 空白; 对于图片格 式和PDF文档格 式的所述文档文件, 使用覆盖图层的方式, 将所述填写内容 的贴图覆盖对应的所述初始槽位的空白。 9.一种槽位标签的生成装置, 其特 征在于, 包括: 存储器; 以及 与所述存 储器连接的处 理器, 所述处 理器被配置成: 获取包含初始槽位的文档文件, 所述文档文件的类型包括DOCX文档格式、 图片格式和/权 利 要 求 书 1/2 页 2 CN 115358186 A 2或PDF文档格式; 获取所述文档文件的初始槽位前后文信息, 利用基于预训练语言模型的提示学习方 法, 根据所述初始槽位前后文信息, 在所述初始槽位处生成对应的提 示掩码; 根据所述 提示掩码, 利用所述预训练语言模型, 预测并生成所述槽位标签。 10.一种计算机存储介质, 其上存储有计算机程序, 其特征在于, 所述计算机程序被机 器执行时实现如权利要求1至8中任一项所述的方法的步骤。权 利 要 求 书 2/2 页 3 CN 115358186 A 3

PDF文档 专利 一种槽位标签的生成方法、装置及存储介质

文档预览
中文文档 20 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种槽位标签的生成方法、装置及存储介质 第 1 页 专利 一种槽位标签的生成方法、装置及存储介质 第 2 页 专利 一种槽位标签的生成方法、装置及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:13:57上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。