VARestorer는 기존 텍스트-이미지 VAR 모델을 초해상도(Real-ISR) 모델로 변환하는 새로운 프레임워크예요. 피라미드 이미지 컨디셔닝과 크로스-스케일 어텐션을 통해 입력 이미지 정보를 최대한 활용하고, VAR 모델의 표현력을 유지하면서 효율성을 높였어요. VARestorer는 DIV2K 데이터셋에서 72.32 MUSIQ, 0.7669 CLIPIQA를 달성하며 기존 방식보다 10배 빠른 추론 속도를 보여줘요.