연구진이 로봇 제어의 기초 모델인 일반 조작 정책의 실제 환경 일반화 성능을 진단하기 위한 ATOM-Bench를 공개했어요. ATOM-Bench는 원자 기술 습득과 조합 일반화 능력을 평가하며, 30개의 원자 작업과 24개의 미지 조합 작업으로 구성돼요. 현재 정책은 간단한 지시-연계 기술 습득에는 성공하지만, 정밀한 모터 원자, 세기 계산, 논리 필터링에서 어려움을 겪고 있으며, 원자 성능이 조합 작업으로 잘 이어지지 않아요.