实验室动态

[ICLR 2024] Differentially Private Synthetic Data via Foundation Model APIs 2: Text

Chulin Xie, Zinan Lin, Arturs Backurs, Sivakanth Gopi, Da Yu, Huseyin A Inan, Harsha Nori, Haotian Jiang, Huishuai Zhang, Yin Tat Lee, Bo Li, Sergey Yekhanin. “Differentially Private Synthetic Data via Foundation Model APIs 2: Text” ICLR 2024 Workshop on Secure and Trustworthy Large Language Models (SET LLM).
本文探讨了利用大模型解决数据隐私问题的方法。本文提出的Aug-PE算法,可以在保证差分隐私的前提下,生成与敏感数据分布相似的合成数据。特别地,该算法仅通过访问大型语言模型(LLM)的API生成差分隐私(DP)高质量合成文本,为隐私保护的大模型应用提供了更便捷的解决方案。