
[AAAI 2020] Cross-Lingual Low-Resource Set-to-Description Retrieval for Global E-Commerce
[AAAI 2020] Cross-Lingual Low-Resource Set-to-Description Retrieval for Global E-Commerce
随着跨境电子商务的繁荣,迫切需要设计智能方法来帮助电子商务卖家为世界各地的消费者提供本地产品。在本文中,我们探索了跨境电子商务中的跨语言商品属性词集合与商品描述的匹配这一跨语言信息检索的新任务。该任务将源语言中的商品属性词集合与目标语言中的清晰细致的商品描述相匹配。我们手动收集一个新的高质量的平行据集,其中每对数据都包含源语言中的无序商品属性词集合和目标语言中的商品描述。由于数据集构建过程耗时且成本高昂,该任务是一个低资源的任务。为了解决这一电商领域跨语言信息检索任务,我们提出了一种新的跨语言匹配网络(CLMN),该网络在预训练的单语言BERT表示的基础上增强了上下文相关的跨语言映射。实验结果表明,我们提出的CLMN在这项具有挑战性的任务上产生了令人印象深刻的结果,与预训练多语言BERT模型相比,我们提出的方法产生了显著的性能提升。