SOLAR-RL은 다중 모드 대규모 언어 모델(MLLM) 기반 GUI 에이전트 훈련을 위한 새로운 강화 학습 프레임워크예요. 온라인 상호 작용 없이도 글로벌 경로 정보를 오프라인 학습에 통합하여 샘플 효율성을 높였어요. 실험 결과, SOLAR-RL은 강력한 기존 방법보다 장기적인 작업 완료율과 안정성이 크게 향상되었음을 보여줬어요.