연구진은 음악 및 일반 오디오를 위한 자동 인코더인 SAME(Semantically-Aligned Music autoEncoder)을 공개했어요. SAME은 4096배의 시간 압축 비율을 달성하면서도 재구성 품질과 다운스트림 생성 성능을 유지해요.
트랜스포머 기반 백본과 의미론적 정규화 방식, 위상 인식 재구성 손실, 개선된 판별기 설계를 결합하여 계산 비용 효율성을 높였어요.
대규모 SAME-L과 CPU 배포 가능한 SAME-S 두 가지 모델을 오픈 웨이트 형태로 공개했어요.