实验室动态

[EMNLP 2023] From Simple to Complex: A Progressive Framework for Document-level Informative Argument Extraction

[EMNLP 2023 Findings] From Simple to Complex: A Progressive Framework for Document-level Informative Argument Extraction

黄曲哲和张雁熙关于文档级事件论元抽取的论文《From Simple to Complex: A Progressive Framework for Document-level Informative Argument Extraction》被EMNLP 2023 Findings接收。

文档级事件论元抽取是事件抽取管道中重要的一步,要求模型从单个文档中抽取出多个事件的论元。考虑到同一文档中不同事件之间潜在的依赖关系,最近的工作引入了“memory”的思想,其中已抽取的事件的结果被缓存,可以被检索以帮助后续事件的抽取。然而,已有方法都是按照事件在文档中出现的先后顺序进行抽取,但一个事件出现在首句中并不代表它是最容易抽取的。如果先前某个事件的错误预测结果被后续事件检索,则可能会引入噪声。因此,为了提供更可靠的memory,我们提出了一个由易到难的渐进式文档级事件论元抽取框架。具体来说,我们首先计算每个事件的难度,再按照由易到难的顺序对同一文档中的事件依次抽取。通过这种方式,memory中将缓存最确定的预测结果,且模型可以使用这些可靠的结果来帮助预测更困难的事件。在WikiEvents数据集上的实验表明,我们的框架在F1上相比SOTA提高1.4%,这表明我们提出的由易到难的框架在事件论元抽取任务中是有用的。