연구진은 소형 MLLM의 계획 능력과 웹사이트 간 일반화 부족 문제를 해결하기 위해 계획 경험 탐색 및 활용(PEEU) 방법을 제안했어요. PEEU는 환경을 자율적으로 탐색하여 경험을 발견하고, 역경험을 활용하여 정렬된 고수준 훈련 데이터를 합성하는 방식이에요. 실험 결과, PEEU를 적용한 7B 모델은 Qwen2.5-VL-32B 모델보다 30.6% 높은 정확도를 기록하며 OOD 계획 능력 향상에 기여했어요.