사용자가 48x48 이미지 생성 Stable Diffusion 모델을 만들고 있습니다. bidirectional transformer encoder를 사용하며 flickr8k와 imagenet 데이터셋으로 학습 중입니다. 현재 loss가 1.1443이며, 학습 진행 상황을 공유할 예정입니다.