专利 一种对话语言模型的训练方法、装置、设备及存储介质

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202211049973.5 (22)申请日 2022.08.30 (71)申请人上海浦东发展银行股份有限公司地址 200000 上海市黄浦区中山东一路12 号 (72)发明人胡岩　郭林海　张琛　万化　 (74)专利代理机构北京品源专利代理有限公司 11332 专利代理师黄立伟 (51)Int.Cl. G06F 16/332(2019.01) G06F 16/35(2019.01) G06F 40/30(2020.01) G06F 40/205(2020.01) G06F 40/284(2020.01)G06N 3/08(2006.01) (54)发明名称一种对话语言模型的训练方法、装置、设备及存储介质 (57)摘要本发明实施例公开了一种对话语言模型的训练方法、装置、设备及存储介质。该方法包括：获取对话语料作为训练样本，从对话语料中提取语义特征编码、片段特征编码和位置特征编码，将语义特征编码、片段特征编码和位置特征编码，输入对话语言模型输出嵌入向量，根据嵌入向量，基于非线性角色分类器，输出至少一个文本片段所属的预测角色，根据对话语料中文本片段所属的实际角色，与预测角色计算角色损失关系，根据角色损失关系对对话语言模型进行优化训练。本发明实施例的技术方案，利用对话语料中提取的角色特征和语义顺序特征等信息，对对话语言模型进行训练，提升了训练对话语言模型的效果。权利要求书3页说明书12页附图3页 CN 115391512 A 2022.11.25 CN 115391512 A 1.一种对话语言模型的训练方法，其特征在于，包括：获取对话语料作为训练样本；其中，所述对话语料包括至少两个角色的至少一轮对话，每个角色在一轮会话中的语言文本作为一个文本片段；从所述对话语料中提取语义特征编码、片段特征编码和位置特征编码；将所述语义特征编码、片段特征编码和位置特征编码，输入对话语言模型输出嵌入向量；根据所述嵌入向量，基于非线性角色分类器，输出至少一个文本片段所属的预测角色；根据所述对话语料中文本片段所属的实际角色，与所述预测角色计算角色损失关系；根据所述角色损失关系对所述对话语言模型进行优化训练。 2.根据权利要求1所述的方法，其特征在于，从所述对话语料中提取语义特征编码之前，还包括：按照设定掩码处理策略，将所述对话语料中的至少一个设定领域词汇进行掩码处理，以更新所述对话语料中的实际字符为掩码字符；相应的，将所述语义特征编码、片段特征编码和位置特征编码，输入对话语言模型输出嵌入向量之后，还包括：根据所述嵌入向量，基于非线性字符分类器，输出所述对话语料中各字符所对应的预测字符；根据所述对话语料中各字符所对应的实际字符，与所述预测字符，计算字符损失关系；根据所述字符损失关系对所述对话语言模型进行优化训练。 3.根据权利要求2所述的方法，其特征在于，根据所述角色损失关系对所述对话语言模型进行优化训练，以及根据所述字符损失关系对所述对话语言模型进行优化训练包括：根据所述角色损失关系和所述字符损失关系，计算总损失关系；根据所述总损失关系对所述对话语言模型进行优化训练。 4.根据权利要求2所述的方法，其特征在于，按照设定掩码处理策略，将所述对话语料中的至少一个设定领域词汇进行掩码处理包括：从所述对话语料识别确定设定领域词汇；按照设定掩码处理策略中的选择比例，从所述对话语料中选择符合所述选择比例的词汇，作为待替换词汇，其中，所述设定领域词汇被选为待替换词汇的几率大于非设定领域词汇被选为待替换词汇的几率；若所述待替换词汇中包含所述设定领域词汇，则将所述待替换词汇中的设定领域词汇的一个或多个字符，以符号或文本进行掩码处理，形成掩码字符。 5.根据权利要求1所述的方法，其特征在于，将所述语义特征编码、片段特征编码和位置特征编码，输入对话语言模型输出嵌入向量包括：将所述语义特征编码、片段特征编码和位置特征编码，拼接为输入向量；将所述输入向量输入对话语言模型，输出嵌入向量；其中，所述嵌入向量与所述输入向量的字符位置相互对应。 6.根据权利要求1 ‑5任一所述的方法，其特征在于：所述语义特征编码用于表征各字符的语义特征，每个字符的语义特征编码记为权　利　要　求　书 1/3 页 2 CN 115391512 A 2将各字符的语义特征编码添加入字符嵌入表，记为Et∈RV×d；其中， e表示一个位置的特征编码， i表示所述对话语料的片段序号， j代表第i个片段中的字符序号，上标t表示语义特征编码， d代表所述对话语料， R表示向量， V 表示词表大小；所述片段特征编码用于表征各文本片段的片段顺序特征，每个文本片段的片段特征编码记为将各片段特征编码添加入片段嵌入表，记为Es∈RS×d；其中， S表示所述对话语料的总文本片段数量；上标s表示片段特征编码；所述位置特征编码用于表征各字符的位置特征，每个字符的位置特征编码记为将各位置特征编码添加入位置嵌入表，记Ep∈RN×d；其中， N表示特征编码的总位置数量，上标p表示位置特征编码。 7.根据权利要求6所述的方法，其特征在于，根据所述对话语料中文本片段所属的实际角色，与所述预测角色计算角色损失关系包括：根据所述对话语料中文本片段所属的实际角色，与所述预测角色，按照如下公式计算角色损失关系：其中： L2()为角色损失关系； Pi3为所述预测角色与所述实际角色相同的概率，为第i 个文本片段的预测角色； θ 为所述对话语言模型的参数； θ2为非线性角色分类器的参数； θ2记为[W3∈Rd×1， b3]； W3∈Rd×1，为非线性角色分类器的矩阵参数， b3是非线性分类器的偏置参数； S为所述对话语料的总片段数量， i为片段序号；为第i个片段的实际角色，表示文本片段的实际角色的取值范围为两个不同值的实际角色；且 Ei1为第i个片段的输入向量中第一个位置的特征编码； sigmo id()非线性角色分类器的函数。 8.根据权利要求6所述的方法，其特征在于，根据所述对话语料中各字符所对应的实际字符，与所述预测字符计算字符损失关系包括：根据所述对话语料中各字符所对应的实际字符，与所述预测字符，按照如下公式计算字符损失关系：其中， L1()为字符损失关系；为所述预测字符与所述实际字符相同的概率；为第k 个掩码字符的预测字符值； θ为所述对话语言模型的参数； θ1为所述非线性字符分类器的参数； M为输入序列中被掩码处理的字符数量； S为所述对话语料的总片段数量；为第k个掩码字符的实际字符值，表示掩码字符的实际字符的位置的取值范围为词表范围；权　利　要　求　书 2/3 页 3 CN 115391512 A 3

专利 一种对话语言模型的训练方法、装置、设备及存储介质

专利一种对话语言模型的训练方法、装置、设备及存储介质