연구진은 VisualWebArena 경로 분석을 통해 불필요한 반복 행동, 숨겨진 발견 비용, 낮은 프롬프트 캐시 재사용 등의 비효율성을 확인했어요.
PANDO는 Skill Library를 유지하며, 진행 상황 반영, 신뢰도 기반 기술 강등, 계층적 라우팅, 시각 압축, 캐시 인식 프롬프팅을 결합한 온라인 기술 증류 프레임워크예요.
PANDO는 910개의 VisualWebArena 작업에서 58.3%의 성공률을 기록하며 SGV(54.0%)와 WALT(45.2%)를 능가하고, SGV보다 58%, WALT보다 61% 적은 토큰을 사용했어요.