AsyncWebRL은 시각 웹 에이전트의 다단계 강화 학습 효율성을 높이는 새로운 방법입니다. 동기식 RL의 유휴 GPU 문제와 불필요한 단계 및 토큰 사용 문제를 동시에 해결합니다. everlasting rollout pool과 가벼운 스크린샷 처리 방식을 통해 기존 방식보다 최대 2.9배 빠른 학습 처리량 속도를 달성했습니다.