무엇을 요약하고 싶은 건지
백문이 불여일견 한번 해보자.
DDPM은 시간에 맞는 샘플을 생산한다. 그래서 variational inference하도록 학습된 Markov chain이다.
여기서 $εθ$를 학습하고 sampling 할때 사용 하는 것을 확인 가능하다.
$εθ$는 neural network이다. 또한 $ε-$$εθ$는 ELBO 공식을 DDPM에 맞게 수정한 모델이다.
추가적으로 재밌는 부분은 저자가 $L_{simple}$을 정의한다. 논문에서
위에 두 공식으로부터 이끌어넨 variational bound를 만든다.
t=1이면 $L_0$와 같다.(공식 13) 그러나 t>1인 순간부터 공식 12에 unweighted와 똑같다. NCSN에 쓰이는 loss weighting과 비슷하다.
결론적으로
저자는 diffusion model로 좋은 퀄리티를 가진 샘플을 얻었다.