实验室动态

[NeurIPS 2021] Stylized Dialogue Generation with Multi-Pass Dual Learning

[NeurIPS 2021] Stylized Dialogue Generation with Multi-Pass Dual Learning

风格化对话生成是智能对话系统中的一个重要组成部分,考虑到对话上文和目标风格回复之间缺乏平行语料,现有的工作主要使用back-translation的方法来生成用于训练的伪风格化数据对。然而,这些文本之间的交互信息并没有得到充分利用,生成的伪数据也没有得到充分而有效地建模。为了缓解上述问题,我们提出了包含三个对偶任务的multi-pass dual learning (MPDL)模型,通过无监督的方式在三个空间域之间建立映射关系,其中对话上文由MPDL重构,重构误差也作为训练信号的一部分。为了有效地评估伪数据的质量,我们引入了一个文本判别器,评测生成的伪数据与特定域的相似性,评测结果作为优化模型的权重,以减少低质量数据对模型性能的影响。本文在两个数据集上的实验结果表明,我们提出的模型比现有的基线模型有明显的效果提升。