公共安全标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210885021.0 (22)申请日 2022.07.26 (71)申请人 广州欢聚时代信息科技有限公司 地址 511442 广东省广州市番禺区南村镇 万博二路79 号万博商务区万达商业广 场北区B-1栋23层 (72)发明人 李咏林  (74)专利代理 机构 广州利能知识产权代理事务 所(普通合伙) 44673 专利代理师 王增鑫 (51)Int.Cl. G06F 16/9532(2019.01) G06F 16/9538(2019.01) G06F 16/33(2019.01) G06F 16/338(2019.01)G06F 40/242(2020.01) G06F 40/247(2020.01) G06F 40/289(2020.01) G06F 40/30(2020.01) G06Q 30/06(2012.01) (54)发明名称 商品查询重定向方法及其装置、 设备、 介质、 产品 (57)摘要 本申请涉及 商品查询重定向方法及其装置、 设备、 介质、 产品, 所述方法包括: 获取搜索表达 式进行分词, 获得分词集, 所述分词集中的分词 为词元或由两个以上的词元构成的短语; 确定所 述分词集中的同义子集, 每个同义子集中包括多 个语义相近的分词; 构造查询表达式, 所述查询 表达式中将 同一同义子集中的分词之间构造为 或运算, 将不同同义子集之间构造为与运算; 根 据所述查询表达式执行对商品信息库中的商品 标题的查询获得查询结果, 以查询表达式的逻辑 运算关系量化查询结果中各个商品的排序分值, 根据排序分值确定所述搜索表达式相对应商品 列表。 本申请能以轻量化的方式实现对商品标题 的精准搜索结果, 为用户匹配出与其搜索表达式 最为匹配的目标商品。 权利要求书2页 说明书16页 附图4页 CN 115203514 A 2022.10.18 CN 115203514 A 1.一种商品查询重 定向方法, 其特 征在于, 包括: 获取搜索表达 式进行分词, 获得分词集, 所述分词集中包括多个分词, 所述分词为词元 或由两个以上的词元构成的短语; 确定所述分词集中的同义子集, 每 个同义子集中包括多个 语义相近的分词; 构造查询表达式, 所述查询表达式中将同一同义子集中的分词之间构造为或运算, 将 不同同义子集之间构造为与运 算; 根据所述查询表达 式执行对商 品信息库中的商 品标题的查询获得查询结果, 以查询表 达式的逻辑运算关系量化查询结果中各个商品的排序分值, 根据排序分值确定所述搜索表 达式相对应商品列表。 2.根据权利要求1所述的商品查询重定向方法, 其特征在于, 获取搜索表达式进行分 词, 获得分词集, 包括: 响应终端设备提交的商品搜索请求, 获得 该请求相对应的搜索表达式; 对所述搜索表达式进行不同字 长级别的分词, 获得不同字 长级别相对应的分词序列; 将分词序列中的每个分词与 预设的分词词表进行匹配, 将命中预设的分词词表的分词 添加至分词集中, 其中, 所述词表包 含多个词元及由两个或两个以上的词元构成的短语。 3.根据权利要求1所述的商 品查询重定向方法, 其特征在于, 确定所述分词集中的同义 子集, 包括: 将所述分词集中的各个分词在预设的同义词库中进行查询, 确定其中属于同一类同义 词的分词构造为相应类别的同义子集, 所述同义词库包括分类设置的同义词表, 每个同义 词表包括 一组在语义上相近的词元。 4.根据权利要求3所述的商 品查询重定向方法, 其特征在于, 确定所述分词集中的同义 子集之前, 包括: 获取预设词典, 所述词典包括至少来源于当前独立站的商品信息库的多个词元; 对所述词典中的各个词元编码输入预先训练至收敛状态的文本特征提取模型提取深 层语义信息, 获得 各个所述的词元相对应的词向量; 计算两两词元构 成的词对的词向量之间的相似度, 确定每个词元映射到其他任意词元 构成的词对的相似度; 以每个词对的相似度为样本点对各个词元进行聚类, 获得多个簇类相对应的同义词 表, 将所有同义词表添加至同义词库。 5.根据权利要求 4所述的商品查询重 定向方法, 其特 征在于, 获取 预设词典之前, 包括: 获取电商平台的历史搜索数据中的历史搜索表达式; 对全量历史搜索表达式进行分词处 理, 获得相应的搜索分词库; 统计搜索分词库中的分词的词频, 保留其中词频高于预设阈值的分词获得 所述词典。 6.根据权利要求1所述的商 品查询重定向方法, 其特征在于, 根据 所述查询表达 式执行 对商品信息库中的商品标题的查询获得查询结果, 以查询表达式的逻辑运算关系量化查询 结果中各个商品的排序分值, 根据排序分值确定所述搜索表达式相对应商品列表, 包括: 对商品信息库中的商品标题执 行查询表达式以获得查询结果; 确定查询表达式中每个分词是否命中商品信息库中同一商品标题相对应的二值化分 值, 其中将属于短语的分词的二 值化分值量化为其各个词元的二 值化分值的均值;权 利 要 求 书 1/2 页 2 CN 115203514 A 2针对查询结果中的每个商品标题, 对应所述查询表达式的逻辑运算关系, 对每个同义 子集取其中的分词的二值化分值的最大值作为小计分值, 累加所有同义子集的小计分值作 为该商品标题的排序分值; 根据所述排序分值选取部分商 品标题相对应的商品, 获取所述商 品相对应的商 品信息 构造出商品列表。 7.根据权利要求6所述的商 品查询重定向方法, 其特征在于, 根据 所述排序分值选取部 分商品标题相对应的商品, 获取 所述商品相对应的商品信息构造出商品列表, 包括: 根据所述 排序分值对查询结果中的商品进行倒排序; 选取预设数量的若干个商品作为目标商品; 获取所述目标商品的商品信息进行逐一格式化后封装为商品列表, 其中, 所述商品信 息包括商品标题、 商品图片、 商品价格以及商品页面链接 。 8.一种商品查询重 定向装置, 其特 征在于, 包括: 分词处理模块, 用于获取搜索表达 式进行分词, 获得分词集, 所述分词集中包括多个分 词, 所述分词为词元或由两个以上的词元构成的短语; 同义处理模块, 用于确定所述分词集中的同义子集, 每个同义子集中包括多个语义相 近的分词; 查询重构模块, 用于构造查询表达式, 所述查询表达式中将同一同义子集中的分词之 间构造为或运 算, 将不同 同义子集之间构造为与运 算; 查询执行模块, 用于根据所述查询表达 式执行对商 品信息库中的商 品标题的查询获得 查询结果, 以查询表达式的逻辑运算关系量化查询结果中各个商品的排序分值, 根据排序 分值确定所述搜索表达式相对应商品列表。 9.一种计算机设备, 包括中央处理器和存储器, 其特征在于, 所述中央处理器用于调用 运行存储于所述存储器中的计算机程序以执行如权利要求1至6中任意一项所述的方法的 步骤。 10.一种计算机可读存储介质, 其特征在于, 其以计算机可读指令的形式存储有依据权 利要求1至6中任意一项 所述的方法所实现的计算机程序, 该计算机程序被计算机调用运行 时, 执行相应的方法所包括的步骤。权 利 要 求 书 2/2 页 3 CN 115203514 A 3

PDF文档 专利 商品查询重定向方法及其装置、设备、介质、产品

文档预览
中文文档 23 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共23页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 商品查询重定向方法及其装置、设备、介质、产品 第 1 页 专利 商品查询重定向方法及其装置、设备、介质、产品 第 2 页 专利 商品查询重定向方法及其装置、设备、介质、产品 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:14:28上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。