연구진이 로봇의 창의적 문제 해결 능력을 평가하는 RoboWits 벤치마크를 공개했어요. RoboWits는 예상치 못한 상황에 대한 적응력과 도구 사용 능력을 평가하도록 설계됐어요. 자동화된 파이프라인을 통해 다양한 시나리오를 생성하고, 기존 로봇 정책과 VLA의 성능을 비교 분석했어요. 기존 VLA는 초기 시나리오에서는 어느 정도 성공하지만, 변형된 시나리오에서는 어려움을 겪어, 실제 환경에서의 적용 가능성에 대한 의문을 제기했어요.