实验室动态

[NeurIPS 2025] Synthesize Privacy-Preserving High-Resolution Images via Private Textual Intermediaries

王浩翔的关于差分隐私高分辨率高质量数据生成的论文《Synthesize Privacy-Preserving High-Resolution Images via Private Textual Intermediaries》被NeurIPS 2025接收。

差分隐私(Differential Privacy, DP)旨在通过在数据或训练过程中加入随机噪声,使单个样本的参与与否对输出结果几乎不产生可区分的影响,从而在数学上严格限制隐私泄漏风险。然而,将 DP 直接应用于高维图像生成仍面临诸多挑战:一方面,图像空间维度极高,传统方法(如 DP-SGD 或 DP 扩散模型训练)需要注入大量噪声,导致图像质量下降、语义可控性不足;另一方面,现有 DP 图像生成方法在多样性(diversity)上表现较弱,经常出现重复模式、语义崩塌或难以保持图像的结构一致性。这些限制使得“既有隐私保护、又有高质量视觉生成”的目标难以同时达成。针对上述问题,我们提出了 SPTI 框架,将差分隐私从高维图像空间迁移至更低维、更结构化的文本空间。该方法在确保严格 DP 预算的前提下,显著改善了图像的清晰度、语义一致性与多样性,相比传统 DP 扩散模型训练获得了更优的 FID、CLIP Score 与主观质量表现。整体而言,本工作提出了一种新的“文本桥接”范式,为高质量差分隐私图像生成提供了更可控、更高效的技术路径。

image.png

基于差分隐私约束的图像数据生成算法