[ACL 2025] Cross-Lingual Transfer of Cultural Knowledge: An Asymmetric Phenomenon
张晨的论文《Cross-Lingual Transfer of Cultural Knowledge: An Asymmetric Phenomenon》被ACL 2025接收。
尽管已有大量研究评估了大语言模型(LLMs)在应对全球文化多样性方面的能力,但其文化知识的获取机制,尤其是在多语言场景下,仍然尚不清楚。本文通过研究大语言模型在语言适配过程中,文化知识如何在不同语言之间迁移,来探讨这一问题。本文提出了一个具有可解释性的研究框架,用以分析这种迁移过程,在保证训练数据透明性的同时控制迁移效应。基于对四种非英语文化的研究,本文观察到英语与其他高资源语言之间存在双向的文化知识迁移,而低资源语言主要向英语迁移文化知识,反向迁移则较为有限。为解释这一非对称现象,本文提出了一个基于频率的假设:在预训练数据中出现频率更高的文化知识更容易发生迁移,这一假设也得到了对训练语料进行实证分析的支持。
王选计算机研究所