北京大学王选所网络信息处理实验室

实验室动态

[EMNLP 2023] From Simple to Complex: A Progressive Framework for Document-level Informative Argument Extraction

[EMNLP 2023 Findings] From Simple to Complex: A Progressive Framework for Document-level Informative Argument Extraction

黄曲哲和张雁熙关于文档级事件论元抽取的论文《From Simple to Complex: A Progressive Framework for Document-level Informative Argument Extraction》被EMNLP 2023 Findings接收。

文档级事件论元抽取是事件抽取管道中重要的一步，要求模型从单个文档中抽取出多个事件的论元。考虑到同一文档中不同事件之间潜在的依赖关系，最近的工作引入了“memory”的思想，其中已抽取的事件的结果被缓存，可以被检索以帮助后续事件的抽取。然而，已有方法都是按照事件在文档中出现的先后顺序进行抽取，但一个事件出现在首句中并不代表它是最容易抽取的。如果先前某个事件的错误预测结果被后续事件检索，则可能会引入噪声。因此，为了提供更可靠的memory，我们提出了一个由易到难的渐进式文档级事件论元抽取框架。具体来说，我们首先计算每个事件的难度，再按照由易到难的顺序对同一文档中的事件依次抽取。通过这种方式，memory中将缓存最确定的预测结果，且模型可以使用这些可靠的结果来帮助预测更困难的事件。在WikiEvents数据集上的实验表明，我们的框架在F1上相比SOTA提高1.4%，这表明我们提出的由易到难的框架在事件论元抽取任务中是有用的。