公共安全标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210923703.6 (22)申请日 2022.08.02 (71)申请人 合肥工业大 学 地址 230009 安徽省合肥市包河区屯溪路 193号 (72)发明人 凌海峰 徐曼如 孙见山 袁昆  钱洋 刘业政 姜元春 柴一栋  陈夏雨 魏少波  (74)专利代理 机构 北京久诚知识产权代理事务 所(特殊普通 合伙) 11542 专利代理师 余罡 (51)Int.Cl. G06F 16/335(2019.01) G06F 16/33(2019.01) G06F 40/30(2020.01)G06Q 50/18(2012.01) (54)发明名称 基于深度学习的专利组合推荐方法及系统 (57)摘要 本发明提供一种基于深度学习的专利组合 推荐方法及系统, 涉及专利推荐技术领域。 本申 请将预先获取的专利数据集划分成专利文本数 据、 专利关系数据, 以及专利结构化数据, 然后由 这三类数据获取专利文本相似度矩 阵和专利表 征向量, 同时将每个企业对应的企业专利数据集 按照时间顺序划分为真实专利组合; 接着利用专 利组合表征学习模型学习并更新专利表征向量; 最后利用上述真实专利组合和更新专利表征向 量训练LS TM模型, 并基于训练后最优的LS TM模型 获取每个专利预测评分, 基于专利文本相似度矩 阵获取专利相似性评分, 最终综合考虑专利预测 评分和专利相似性评分为企业进行专利组合推 荐。 本发明相比于现有技术专利组合推荐精度更 高, 可为企业批量推荐专利。 权利要求书2页 说明书13页 附图5页 CN 115455172 A 2022.12.09 CN 115455172 A 1.一种基于深度学习的专利组合推荐方法, 其特 征在于, 所述方法包括: 获取专利数据集, 并将所述专利数据集划分成专利文本数据、 专利关系数据, 以及专利 结构化数据; 基于所述专利文本数据获取专利文本表征向量和 专利文本相似度矩阵, 基于所述专利 关系数据获取专利关系表征向量, 以及基于专利结构化数据获取专利结构化表征向量, 并 将所述专利文本表征向量、 专利 关系表征向量, 以及专利结构化表征向量进行向量拼接得 到专利表征向量; 基于所述专利数据集将每个企业对应的企业专利数据集按照时间顺序划分为真实专 利组合; 将所述专利表征向量利用专利组合表征学习 模型学习后获取更新专利表征向量, 并基 于所述更新专利表征向量获取专利组合表征向量; 利用所述真实专利组合和所述专利组合表征向量训练LSTM模型, 并基于训练后的LSTM 模型获取每个专利预测评分, 基于所述专利文本相似度矩阵获取专利相似性评分, 并基于 每个所述专利预测评分和所述专利相似性评分进行专利组合推荐。 2.如权利要求1所述的方法, 其特征在于, 所述专利文本数据包括: 专利标题文本数据; 所述专利关系数据包括: IPC分类号数据、 发明人数据和代理机构数据; 所述专利 结构化数 据包括: 引用次数、 被引用次数、 专利家族成员数、 发明人 人数和权利要求数。 3.如权利要求1所述的方法, 其特征在于, 所述基于所述专利关系数据获取专利关系表 征向量包括: 将所述专利关系数据中的所有专利关系按照任意三种专利关系为一个三元组的方式 获取三元组关系数据集; 基于所述 三元组关系数据集构建专利 ‑节点关系图数据集; 基于所述专利 ‑节点关系图数据集训练多关系图卷积神经网络模型; 将所述专利 ‑节点关系图数据集输入训练好的所述多关系图卷积神经网络模型中获取 专利关系表征向量; 所述基于专利结构化数据获取专利结构化表征向量包括: 将每个所述专利结构化数据转化为一个多维结构化向量, 并将所述多维结构化向量进 行0均值标准 化以得到专利结构化表征向量。 4.如权利要求1所述的方法, 其特征在于, 所述专利组合表征学习模型包括Lite   Transformer层, 所述 Lite Transformer层仅由一个Transformer  Encoder组成。 5.如权利要求1所述的方法, 其特征在于, 所述基于每个所述专利预测评分和所述专利 相似性评分进行专利组合推荐包括: 将所述专利预测评分和所述专利相似性评分求和得到每个专利的最终评分, 然后选取 预设个数个所述 最终评分靠前的专利作为 一个专利组合进行专利组合推荐。 6.一种基于深度学习的专利组合推荐系统, 其特 征在于, 所述系统包括: 数据获取和划分模块, 用于获取专利数据集, 并将所述专利数据集划分成专利文本数 据、 专利关系数据, 以及专利结构化数据; 向量获取及拼接模块, 用于基于所述专利文本数据获取专利文本表征向量和 专利文本 相似度矩阵, 基于所述专利关系 数据获取专利关系表征向量, 以及基于专利结构化数据获权 利 要 求 书 1/2 页 2 CN 115455172 A 2取专利结构化表征向量, 并将所述专利文本表征向量、 专利关系表征向量, 以及专利结构化 表征向量进行向量 拼接得到专利表征向量; 真实专利组合获取模块, 用于基于所述专利数据集将每个企业对应的企业专利数据集 按照时间顺序划分为真实专利组合; 专利组合表征学习模块, 用于将所述专利表征向量利用专利组合表征学习模型学习后 获取更新专利表征向量, 并基于所述更新专利表征向量获取专利组合表征向量; 专利组合推荐模块, 用于利用所述真实专利组合和所述专利组合表征向量训练LSTM模 型, 并基于训练后的LSTM模型获取每个专利 预测评分, 基于所述专利文本相似度矩阵获取 专利相似性评分, 并基于每个所述专利预测评分和所述专利相似性评分进行专利组合推 荐。 7.如权利要求6所述的系统, 其特征在于, 所述专利文本数据包括: 专利标题文本数据; 所述专利关系数据包括: IPC分类号数据、 发明人数据和代理机构数据; 所述专利 结构化数 据包括: 引用次数、 被引用次数、 专利家族成员数、 发明人 人数和权利要求数。 8.如权利要求6所述的系统, 其特征在于, 所述向量获取及拼接模块基于所述专利关系 数据获取专利关系表征向量包括: 将所述专利关系数据中的所有专利关系按照任意三种专利关系为一个三元组的方式 获取三元组关系数据集; 基于所述 三元组关系数据集构建专利 ‑节点关系图数据集; 基于所述专利 ‑节点关系图数据集训练多关系图卷积神经网络模型; 将所述专利 ‑节点关系图数据集输入训练好的所述多关系图卷积神经网络模型中获取 专利关系表征向量; 所述基于专利结构化数据获取专利结构化表征向量包括: 将每个所述专利结构化数据转化为一个多维结构化向量, 并将所述多维结构化向量进 行0均值标准 化以得到专利结构化表征向量。 9.如权利要求6所述的系统, 其特征在于, 所述专利组合表征学习模型包括Lite   Transformer层, 所述 Lite Transformer层仅由一个Transformer  Encoder组成。 10.如权利要求6所述的系统, 其特征在于, 所述基于每个所述专利预测评分和所述专 利相似性评分进行专利组合推荐包括: 将所述专利预测评分和所述专利相似性评分求和得到每个专利的最终评分, 然后选取 预设个数个所述 最终评分靠前的专利作为 一个专利组合进行专利组合推荐。权 利 要 求 书 2/2 页 3 CN 115455172 A 3

PDF文档 专利 基于深度学习的专利组合推荐方法及系统

文档预览
中文文档 21 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于深度学习的专利组合推荐方法及系统 第 1 页 专利 基于深度学习的专利组合推荐方法及系统 第 2 页 专利 基于深度学习的专利组合推荐方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:14:21上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。