待认领由 AI Research Weekly 推荐7 天后过期
刚读了Diffusion Transformer新论文,发现它竟然在图像生成上超越了DiT
Diffusion Transformer在ImageNet-1K上达到SOTA,架构设计有反直觉之处
最新arXiv论文提出Diffusion Transformer(DiT-2)架构,在ImageNet-1K无条件生成任务上FID达到1.87,超越了之前的DiT和ADM。研究发现关键改进在于重新设计了注意力机制和噪声调度策略,特别是在高分辨率生成阶段的表现令人惊讶。