(19)国家知识产权局
(12)发明 专利
(10)授权公告 号
(45)授权公告日
(21)申请 号 202210919249.7
(22)申请日 2022.08.02
(65)同一申请的已公布的文献号
申请公布号 CN 114970491 A
(43)申请公布日 2022.08.30
(73)专利权人 深圳市城市公共安全技 术研究院
有限公司
地址 518000 广东省深圳市福田区福田街
道福安社区福华一路1号深圳大中华
国际交易广场10层、 1 1层
(72)发明人 徐大用 习树峰 蒋会春 沈赣苏
张少标 房龄航 秦宇 张杰
凌君 张波 焦圆圆
(74)专利代理 机构 北京三聚阳光知识产权代理
有限公司 1 1250
专利代理师 李博洋
(51)Int.Cl.
G06F 40/194(2020.01)
G06F 40/205(2020.01)G06F 40/242(2020.01)
G06F 40/295(2020.01)
G06F 40/30(2020.01)
(56)对比文件
CN 110442872 A,2019.1 1.12
CN 103294663 A,2013.09.1 1
CN 111428470 A,2020.07.17
CN 113743125 A,2021.12.0 3
CN 110287497 A,2019.09.27
CN 113553830 A,2021.10.26
CN 113297367 A,2021.08.24
CN 112597309 A,2021.04.02
CN 113869033 A,2021.12.31
杨秋红.面向新闻话题的社交媒体文本上 下
文衔接研究. 《中国优秀硕士学位 论文全文数据
库信息科技 辑》 .2018,(第 (2018) 02期), (续)
审查员 毛小丽
(54)发明名称
一种文本衔接性判断方法、 装置、 电子设备
及存储介质
(57)摘要
本发明实施例涉及计算机技术领域, 尤其涉
及一种文本衔接性判断方法、 装置、 电子设备及
存储介质。 该方法包括: 获取目标文本, 对目标文
本进行解析, 得到目标文本的任务关键语段, 基
于预设的命名实体识别模型及所述任务关键语
段, 得到任务关键语段中的标签命名实体, 基于
标签命名实体, 确定各个任务关键语段之间的衔
接性判断结果。 通过在锁定任务关键语段之后,
进一步地获得任务关键语段中的标签命名实体,
利用这些标签命名实体计算任务关键语段之间
的衔接性, 明确了在一段文本中, 各个语段时间
的衔接性关系可以充分的判断出, 文本中后文的
预案是否能解决前文中的问题, 提高了工作效率。
[转续页]
权利要求书3页 说明书11页 附图3页
CN 114970491 B
2022.10.04
CN 114970491 B
(56)对比文件
Mirella Lapata.Automatic Evaluati on
of Text Coherence: Models and Representati ons. 《Proce edings of IJCAI》
.2015,2/2 页
2[接上页]
CN 114970491 B1.一种文本衔接性判断方法, 其特 征在于, 包括:
获取目标文本;
对所述目标文本进行解析, 得到所述目标文本的任务关键语段;
基于预设的命名实体识别模型及所述任务关键语段, 得到所述任务关键语段中的标签
命名实体;
基于所述标签命名实体, 确定各个所述任务关键语段之间的衔接性判断结果;
所述基于所述标签命名实体, 确定各个所述任务关键语段之间的衔接性判断结果, 包
括:
将各个所述标签命名实体输入至预先设定的语义评估模型, 确定各个所述标签命名实
体之间的语义相似度;
基于所述语义相似度, 确定所述标签命名实体之间是否存在连接;
获取各个所述任务关键语段对应的所述标签命名实体的连接个数;
获取各个所述任务关键语段对应的所述标签命名实体的元 素个数;
基于所述元素个数和所述连接个数, 确定各个所述任务关键语段之间的衔接性判断结
果;
其中, 所述基于所述语义相似度, 确定所述标签命名实体之间是否存在连接, 包括:
当所述语义相似度大于预设的第一阈值时, 认定所述标签命名实体之间存在连接;
否则, 认定所述标签命名实体之间不存在连接;
其中, 按照如下公式计算任务关键语段之间的衔接性:
,
其中,
表示任务关键语段A与任务关键语段B之间的衔接度;
表示任务关
键语段A与任务关键语段B连接的标签命名实体个数;
表示任务关键语段A中所有标
签命名实体个数;
表示任务关键语段B与任务关键语段A连接的标签命名实体个数;
表示任务关键语段B中所有标签命名实体个数; 其中,
的取值越大, 代表任务
关键语段A和任务关键语段B的衔接性越好。
2.根据权利要求1所述的方法, 其特征在于, 所述对所述目标文本进行解析, 得到所述
目标文本的任务关键语段, 包括:
将所述目标文本 输入至预 先设置的初始分析模型, 确定初始分析 结果;
基于预先设置的知识库和所述初始分析 结果, 确定 至少两个过程语段;
利用预先设置的关键短语提取模型对各个所述过程语段进行关键短语提取, 确定关键
短语提取 结果;
根据所述关键短语提取 结果, 得到所述目标文本的任务关键语段。
3.根据权利要求2所述的方法, 其特征在于, 所述利用预先设置的关键短语提取模型对
各个所述过程语段进行关键短语提取, 确定关键短语提取 结果, 包括:权 利 要 求 书 1/3 页
2
CN 114970491 B
3
专利 一种文本衔接性判断方法、装置、电子设备及存储介质
文档预览
中文文档
19 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-03-03 12:14:21上传分享