Residual Dense Network for Image Super-Resolution
RRDB으로 유명한 모델. 기존까지 complexity하고 input을 잘 기억 못하는 모델 문제점을 해결함. residual을 정말 많이 사용하는데 residual로 memory를 잡고 hierarchy features를 잡는 훌륭한 성능을 낸 구조임. 그리고 구조에 대해 세세한 설명으로 다시 읽을만한 가치가 높음. 5月 Spotlight 의문: RRDB을 U-Net에 깊게 많이 적용해볼 수 있을까
기존 Blended Diffusion은 시간이 오래걸리는 문제점이 있음. 그래서 latent diffusion에 넣는 형식으로 제안함. 결론적으로 시간이 단축되었음. 하지만 latent space에 반복적으로 mask를 넣다보니 mask shirinking(마스크가 없어짐) 문제가 있기에, 이 문제 해결을 위해 dilated version을 만들어 해결함.
하지만 latent space에 넣으면서 spatial 같은 정보가 손상되는 걸 방지하는 기법을 고안해야할 듯함.
5月 Spotlight
Imagic: Text-Based Real Image Editing with Diffusion Models
3단계로 이미지 edit을 제안함. linear interpolation이 가능한 부분이 가장 흥미로움. 그리고 embedding에 많은 심혈을 기울임. 또한 TEdBench라는 image editing에 standard benchmark를 제안함. 좋은 논문임.
5月 Spotlight
A Latent Transformer for Disentangled Face Editing in Images and Videos
최근(23.05.24) 유행한 이미지 편집 프로그램에 기반이 되는 논문. 3개의 loss와 extended latent space trasformer 그리고 classifier로 이미지나 비디오에 Editing이 쉽게 되도록 유도함. 좋은 논문임. 옛날 논문이지만 충분히 Diffusion에 적용이 가능할듯하여 조사 해볼 예정.
5月 spotlight