DyaPlex는 양방향 상호작용을 위한 음성 및 제스처 모델로, 사람의 소통 방식을 모방해 동시에 음성과 제스처를 생성합니다. 이 모델은 기존 음성 모델의 장점을 활용하고 새로운 제스처 경로를 통합하여 음성과 제스처를 완벽하게 동기화합니다. Seamless Interaction 데이터셋으로 학습하여 4000시간 동안의 상호작용을 포착하고, 단독 및 양방향 벤치마크에서 최고 성능을 달성했습니다.