수화 번역 시스템은 입력 차원을 줄이고 이식성을 높이며 서명자를 부분적으로 익명화하기 위해 원시 비디오 대신 자세 시퀀스를 활용하는 경우가 많아요.
연구에서는 MediaPipe Holistic, OpenPose 등 널리 사용되는 기준점과 MMPose WholeBody, OpenPifPaf 등 최신 모델을 포함하여 자세 추정기를 체계적으로 비교했어요.
SDPose와 Sapiens가 가장 뛰어난 번역 성능(BLEU ~11.5)을 달성했으며, 일반적인 MediaPipe 기준점(BLEU ~10)보다 우수했어요.