1. Zero-Shot Text-to-Image Generation
DALL-E 모델을 제안한 모델임. 자세한 연구 내용과 zero-shot에 집중한 모델임. 2단계를 걸쳐 학습을 진행함. 그리고 무거운 모델과 큰 데이터를 학습하기 위해 GPU에 방법에 대해서도 설명함.