연구진은 복잡한 실세계 손상으로부터 고품질 이미지를 복원하는 Real-ISR의 효율성 문제를 해결하기 위해 SANA-SR 프레임워크를 제안했어요.
SANA-SR은 32배 압축 비율의 오토인코더를 사용하여 불필요한 토큰을 줄이고, 선형 복잡도 DiT 모델과 LoRA를 적용하여 효율적인 고해상도 복원을 가능하게 해요.
실험 결과 SANA-SR은 기존 방법 대비 우수한 성능을 보였으며, 0.019초에 407.95G MACs, 344M 파라미터로 모바일 기기에도 적용 가능할 정도로 효율적이에요.