专利 一种用于事件检测的语义感知方法

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202211027619.2 (22)申请日 2022.08.26 (71)申请人昆明理工大学地址 650500 云南省昆明市呈贡区景明南路727号 (72)发明人余正涛　严海宁　黄于欣　张亚飞　 (74)专利代理机构昆明隆合知识产权代理事务所(普通合伙) 53220 专利代理师何娇 (51)Int.Cl. G06F 40/211(2020.01) G06F 40/30(2020.01) G06F 16/33(2019.01) G06N 3/08(2006.01) (54)发明名称一种用于事件检测的语义感知方法 (57)摘要本发明涉及用于事件检测的语义感知方法。由于高频事件触发词往往主导ED模型的预测，且 ED模型不能很好地理解上下文信息，导致在某些情况下无法识别事件类型，本发明能更加关注上下文来改变事件触发器的主导地位。提出的新颖的语义表征，以深入挖掘事件触发器和上下文之间的潜在联系，使ED模型更好地理解上下文信息。只需要在验证集上进行轻量级的训练，就能搭载在在任何训练好的模型上，无需昂贵的再训练和微调。在公共ACE2005数据集上的大量实验结果表明了该方法的有效性和可移植性。本发明优于之前 12个最先进的(SOTA)事件检测模型，对于F1值和F0.5值分别提升了5.1％和2.2％。权利要求书2页说明书9页附图2页 CN 115470772 A 2022.12.13 CN 115470772 A 1.一种用于事件检测的语义感知方法，其特征在于：所述方法具体如下： Step1：准备数据集，对公共数据集ACE2005数据进行预处理，将处理好的数据准备输入到模型中； Step2：将处理好的数据输入基线模型DMBERT中，获得触发词和预测的概率分布； Step3：将处理好的数据和已获得的触发词以及概率，输入到语义感知插件SAP，插件包括：语义表征模块和语义感知交互层； Step4：利用相似性度量，决定最终的预测结果。 2.根据权利要求1的用于事件检测的语义感知方法，其特征在于：所述Step1的具体步骤为： Step1.1：通过下载网上公开数据集ACE2005，该数据集包含599个文档，其中训练集、验证集和测试集的文档数量分别为529、 30和40，并定义了34种事件类型；随后插入分隔符记号到文本中，用符号Sw表示；最后将处理好的数据准备输入到模型中。 3.根据权利要求1的用于事件检测的语义感知方法，其特征在于：所述Step2的具体步骤为： Step2.1：将处理好的数据输入到基线模型DMBERT中，先经过BERT编码，表示如下： {h1， ...， ht， ...， hm}＝BERT{Sw} 其中{h1， ...， ht， ...， hm}是BERT编码的隐状态， ht表示触发词t的隐状态； Step2.2：当给定序列中有n个触发词，上下文被划分为n+1个部分，利用最大池化层对每个部分进行操作得到上下文特征，表示如下： c＝[c1； ...； cn+1] 其中c是上下文特征， [； ]表示拼接操作， max( ·)表示最大池化层操作， jn， (n＝1， 2， ...， n)表示触发词t所在的位置； Step2.3：对上下文特征c经过线性变换和层归一化得到概率分布，以及定义损失函数，表示如下：其中f(·)表示线性变换和层归一化操作，表示预测的概率分布， pi， y真实标签的分布，是定义的损失函数。 4.根据权利要求1的用于事件检测的语义感知方法，其特征在于：所述Step3的具体步骤为： Step3.1：给定序列Sw中，将触发词t对应位置替换为占位符[MASK]，得到： Smark＝([CLS]， w1， ...， [MASK]， . ..， wm， [SEP]) 其中Smark表示掩码后的文本；权　利　要　求　书 1/2 页 2 CN 115470772 A 2Step3.2：掩码文本Smark经过掩码语言模型，来预测可能会出现在掩码位置的单词，表示如下： Hmask＝BERT(Smask) pmask＝softmax(f(Hmask)) 其中Hmask是掩码文本Smark的隐状态， f( ·)表示线性变换和层归一化操作， pmask表示预测单词的概率； Step3.3：根据预测单词的概率选取得到Top ‑K1候选触发词并对 Top‑K1候选触发词和经过基线模型DMBERT得到的触发词t进行编码得到语义特征和触发词特征，表示如下： Ki＝LargestK(pmask， K1) 其中LargestK(pmask， K1)返回对应于预测单词概率pmask中最大的K1个元素的候选词， g (·)表示glove embedding将每个候选触发词转变成50维向量，表示语义特征，表示触发词特征； Step3.4：将语义特征和触发词特征拼接后，得到语义表征，表示如下：其中表示语义表征， [； ]表示拼接操作； Step3.5：对基线模型对每个事件类型的预测概率进行排序，最后选取Top ‑K2事件类型及其预测概率然后通过语义感知交互层SAInt，语义信息融入基线模型DMBERT中，来干预基线模型的预测结果，最终得到插件的预测结果，表示如下：其中是可学习参数，语义感知交互层SAInt是由5层多层感知机组成。 5.根据权利要求1的用于事件检测的语义感知方法，其特征在于：所述Step4的具体步骤为： Step4.1：考虑到基线模型DMBERT的预测并非都错误，所以使用相似性度量来决定最终的结果，是采用基线模型的结果还是插件的结果，表示如下：其中Eold是基线模型的预测结果， ESAInt是语义感知插件的预测结果， δ∈(0， 1)表示决定采用哪个结果的相似度阈值，是语义特征，是触发词特征。权　利　要　求　书 2/2 页 3 CN 115470772 A 3

专利 一种用于事件检测的语义感知方法

专利一种用于事件检测的语义感知方法