ActWorld는 사용자의 행동에 반응하는 상호작용 세계 모델입니다. 기존 모델의 한계인 제한적인 상호작용을 극복하고, 물체 조작과 같은 행동을 지원합니다.
데이터 부족과 메모리 병목 현상을 해결하기 위해 10만 개의 상호작용 영상 데이터셋을 구축하고, 행동 기반 메모리 설계를 도입했습니다.
ActWorld는 탐색과 상호작용을 모두 지원하며, 기존 모델보다 상호작용 정확도가 향상되었습니다. 프로젝트 페이지는 https://interactwm.github.io/ActWorld에서 확인할 수 있습니다.