연구진이 텍스트 기반 3D 손-객체 상호작용 생성 프레임워크 TextHOI-3D를 발표했어요. 이 프레임워크는 텍스트 의미, 객체 기하학, 손 모양, 물리적 접촉을 보존하는 3D 모델 생성을 목표로 합니다.
TextHOI-3D는 생성된 멀티뷰 관측값을 텍스트 기반 시각 생성과 기하학 기반 손-객체 복구 사이의 인터페이스로 활용하며, 멀티뷰 환경에서 객체 CD를 4.92mm로, 침투 부피를 0.2193cm^3로 줄였습니다.
HO3D 평가에서 멀티뷰 설정은 손 오류와 표면 F-스코어를 개선하며, 텍스트 기반 3D 손-객체 메시지 생성을 위한 효과적인 중간 표현임을 입증했습니다.