연구진이 Teacher와 Student 모델의 잠재 공간 차이를 극복하는 Cross-Space Distillation 방법을 제시했어요. 이를 위해 Student 모델의 잠재 공간을 Teacher 공간에 매핑하는 Bridge라는 가벼운 인터페이스를 개발했어요. Bridge는 Student VAE 디코더와 학습 가능한 프로젝터로 구성되어 있으며, 잠재 공간 재구성 및 어텐션 충실도 목표를 통해 Teacher 공간에 안정적으로 정렬돼요.
Cross-Space Distillation을 통해 SD 1.5 모델의 HPSv3 점수가 5.4에서 9.4로 향상되는 등, 저해상도 모델의 성능을 크게 개선할 수 있었어요. Bridge는 Student 모델의 구조를 변경하지 않고도 Teacher 모델의 지식을 효과적으로 전달할 수 있도록 해줘요.
연구 결과는 현대적인 고용량 Teacher 모델이 효율적이고 배포 가능한 Student 모델로 지식을 전달할 수 있음을 보여주며, 잠재 공간 인터페이스의 중요성을 강조해요.