연구진이 비디오 확산 모델을 활용한 손 동작 재구성 방법인 ViDiHand를 발표했어요. 기존 방법의 한계를 극복하고 ARCTIC, HOT3D, HOI4D 데이터셋에서 성능을 크게 향상시켰어요.
ViDiHand는 사전 학습된 비디오 확산 모델의 표현을 활용하여 4D 양손 포즈를 재구성하며, 별도의 검출기나 보정 없이 전체 프레임을 직접 처리해요.
연구 결과는 비디오 확산 모델이 손 동작 재구성을 위한 강력한 기반이 될 수 있음을 보여주며, 임베디드 AI를 위한 야외 데이터 수집의 새로운 가능성을 제시해요.