사람은 이미지의 low-frequencies에 더 민감함에도 diffusion model은 각 주파 요소에 중요도를 신경쓰지 않았다. 이미지 데이터에 Inductive Bias를 통합하려면 생성된 이미지의 지각하는 퀄리티를 높이기 위해 이미지의 거친 패턴에 집중해왔다. 예시로 주로 re-weighted variational lower bound 학습을 사용하는데, 인지 못하는 디테일에 덜 집중하고 이미지의 거친 정도나 전체적으로 일관성을 강조했다. 이 diffusion model의 성과는 coarse-to-fine 기법을 도입해 성능이 향상되었다.(저해상도 이미지 생성후 별도의 diffusion upsamplers로 upsampled하는 방법이다)

이 생성과정은 거친 구조를 생성하는 단계와 디테일을 추가하는 단계로 있는데 납득할만한 이미지를 생성하는 능력이 있다. (특히 고해상도)

그러나 단계를 수를 나눈 것은 각 단계를 위한 별개 upsampler를 학습이 필요하다. 이 논문에서 저자는 새로운 방법을 제안한다. upsampler, separte stage도 필요하지 않다. 대신 벡터의 각 요소에 다른 velocities를 조절하는 좌표계로 diffusion이 가능한 diffusion model을 생성한다. 저자는 blur diffusion을 제안하는데 이미지의 frequency component는 다른 속도로 diffused된다.

<aside> 💡 Blur diffusion을 위해 수학적으로 다시 정리하고 연산량을 줄이기 위해 선형대수학을 잘 사용한다. 그리고 각 component마다 바뀐다는 것이 정말 정말 중요한 개념이다.

</aside>