[ACL 2022] ProphetChat: Enhancing Dialogue Generation with Simulation of Future Conversation
[ACL 2022] ProphetChat: Enhancing Dialogue Generation with Simulation of Future Conversation
生成式对话模型是智能人机对话系统的重要方法。经典的对话生成模型基于历史对话信息生成回复,然而,由于在对话中,一句话通常可以由多个不同的候选回复恰当地回答,这种“一对多”的问题导致了仅仅基于对话历史信息生成信息丰富的回复并不容易。受到双向语言模型的启发,我们认为,如果在对话历史信息以外,让模型能够提前“预见”用户在收到回复后将要谈论的内容(即对话未来),并将其作为额外信息辅助生成回复,那么它可能可以生成一个更丰富充实的回复。为此,我们提出了一个名为 ProphetChat 的新型对话生成框架,该框架通过在生成阶段模拟对话未来从而增强回复生成的能力。为了使模型能够预见对话未来,我们基于一个经典的对话生成模型和一个对话选择模型设计了一个类似于集束搜索的对话模拟算法来模拟可能的对话未来。然后,我们同时利用对话历史信息和模拟出的对话未来信息共同生成更加丰富充实的回复。为了让模型更好地进行对话未来模拟和联合基于对话历史和对话未来的回复生成,我们还设计了基于强化学习的训练方法。我们在两个常用的的开放域对话数据集DailyDialog和PersonaChat上进行的实验表明,ProphetChat 相比强力的基线模型可以生成更好的回复。