연구진은 이미지 모델링을 위한 새로운 벡터 양자화 프레임워크인 ArcVQ-VAE를 제안했습니다. ArcVQ-VAE는 기존 VQ-VAE의 코드북에 구면 각도 마진 우선순위를 도입하여 잠재 표현의 다양성을 향상시킵니다.
Ball-Bounded Norm Regularization과 ArcCosine Additive Margin Loss를 통해 코드북 벡터를 제약하고 분리성을 높여 효과적인 잠재 공간 커버리지를 개선합니다.
이미지 재구성 및 생성 실험 결과, ArcVQ-VAE는 기존 모델과 경쟁력 있는 성능을 보였습니다. 코드는 GitHub에서 확인할 수 있습니다.