연구진은 복잡한 환경에서 로봇이 유연한 지시와 여러 객체를 이해하며 장기적인 조작을 수행하도록 돕는 VoLoAgent를 개발했어요. VoLoAgent는 VLM을 사용하여 로봇의 다양한 기능을 도구처럼 활용하며, 물리적 환경의 제약 조건에 맞춰 실시간으로 계획, 실행, 모니터링, 복구를 수행해요. 새로운 RoboVoLo 벤치마크를 통해 VoLoAgent가 기존 방식보다 뛰어난 성능을 보였으며, 실제 로봇 실험에서도 검증됐어요.