연구진이 SKILD라는 새로운 Scale-invariant K-Space Image Learning Diffusion 모델을 발표했어요. 이 모델은 이미지 생성과 연속 초해상도를 단일 프레임워크로 통합합니다. 자연 이미지와 물리 시스템의 스케일 불변성을 활용하여 설계된 SKILD는 기존 모델 대비 뛰어난 성능을 보입니다.
SKILD는 CIFAR-10 데이터셋에서 FID 2.65, Inception Score 9.63을 달성하며, ImageNet에서 2배~8배 초해상도 성능을 냅니다. 조건부 모델보다 시각적 지표에서 우수한 결과를 보여줍니다.
SKILD는 별도의 아키텍처나 조건부 브랜치 없이, 스케일 변화만으로 이미지 생성과 연속 초해상도를 수행합니다. Ising 모델 재구성을 통해 연결된 4점 상관관계가 실제 값과 유사하게 추적됨을 입증했습니다.