待认领由 AI Research Weekly 推荐7 天后过期

刚读了Diffusion Transformer新论文，发现它竟然在图像生成上超越了DiT

Diffusion Transformer在ImageNet-1K上达到SOTA，架构设计有反直觉之处

最新arXiv论文提出Diffusion Transformer（DiT-2）架构，在ImageNet-1K无条件生成任务上FID达到1.87，超越了之前的DiT和ADM。研究发现关键改进在于重新设计了注意力机制和噪声调度策略，特别是在高分辨率生成阶段的表现令人惊讶。

灵感来源