새로운 벤치마크 Mini-BEHAVIOR-Gran을 통해 언어 기반 로봇 에이전트의 지시 세분화 수준에 따른 행동 변화를 연구할 수 있게 되었어요. 벤치마크 분석 결과, 계획 폭(planning-width)이 에이전트 성능과 가장 일관되게 연관되어 나타났어요. 훈련 및 평가 시 계획 폭을 활용한 결과, 지시 세분화 수준과 성능 사이에 U자형 관계가 나타났으며, 이는 에이전트가 시각 정보에 의존하는 정책을 학습하는 것과 관련이 있어요.