TMD-Bench는 음악-댄스 공동 생성 시스템을 평가하는 새로운 벤치마크로, 단일 모드 생성 품질, 지시 준수, 그리고 양방향 리듬 정렬을 평가합니다. Veo 3와 Sora 2 같은 상용 오디오-비디오 모델은 고품질의 음악과 비디오를 생성하지만, 리듬 결합은 여전히 개선의 여지가 있습니다. RhyJAM은 리듬에 맞춰 학습된 데이터로 훈련되어 비트 수준의 동기화를 유지하면서도 단일 모드 충실도를 유지하는 경쟁력 있는 성능을 보여줍니다.