Score-based Generative Modeling in Latent Space
10 Jun 2021 VAE랑 합친 논문. VAE와 Diffusion을 동시에 학습. Diffusion은 VAE의 latent space에서 학습된다.
SRDiff: Single Image Super-Resolution with Diffusion Probabilistic Models
비교적 작은 모델로 resolution을 높임. HR image와 upsampled LR image 차이를 예측하기 위해 residual prediction과 입력한 residual image 차이를 표시함. 그리고 RRDB 구조를 이용하여 좋은 결과를 가져옴. 또한 contracting path, expansive path는 local하고 global한 정보를 결합 할 수 있게해주며 multi-skip connection으로 안정적인 학습을 가함. 마지막으로 LR encoder는 LR를 encode하는데 RRDB 구조에 normalization을 없애는 대신 SRFlow로 대체함.
Multi-Concept Customization of Text-to-Image Diffusion (1)
1)model 일부만 fine-tuning + 2) text optimization 을 통해서 Large text-to-image Diffusion model을 few-shot user images 상에서 customizing 하는 논문
3. gDDIM: Generalized denoising diffusion implicit models (1)
DDPM, DDIM, 등등을 모두 SDE의 형태로 전환, Blur Diffusion이나 Critically-Damped Langevin Diffusion 까지도 SDE로 표현한 뒤, general한 form의 SDE -> DDIM을 만드는 방법을 제안한다. 이를 통해 istropic diffusion models까지 DDIM으로 fast sampling 가능하게 함
4. On Fast Sampling of Diffusion Probabilistic Models (1)
FastDPM은 unified framework를 제공한다. 속도와 퀄리티 trade off를 최소한으로 줄이는 방법이다. discrete를 continuous하게 바꾸고 Bijective mapping을 통해 얻은 결과이다. variance를 바꾸는데 이에 바꾼 sample 학습방법을 따르면 된다.