Pulse · AI 뉴스

VISTA: GUI 그라운딩을 위한 시점 일관성 기반 자가 검증 학습

Qwen · 2026-06-13

연구진은 GRPO(Group Relative Policy Optimization) 기반 GUI 그라운딩 학습 시, 단일 스크린샷 뷰에서 샘플링된 rollout이 그룹 내 어려움 또는 쉬운 인스턴스로 인해 유용한 상대적 이점을 제공하지 못하는 문제를 해결하기 위해 VISTA(View-Consistent Self-Verified Training) 프레임워크를 제안했어요.

VISTA는 동일 GUI 인스턴스의 여러 시점 뷰에서 비교 그룹을 구성하며, 각 뷰는 타겟 요소를 유지하는 크롭과 정확한 박스 리매핑을 통해 생성돼 모델 rollout을 비교해요.

ScreenSpot-Pro 벤치마크에서 Qwen3-VL 4B/8B/30B-A3B의 정확도를 각각 55.5%/52.7%/53.7%에서 63.4%/65.8%/67.0%로 향상시키는 등, 5개의 GUI 그라운딩 벤치마크에서 일관된 성능 향상을 보였어요.

##GUI##그라운딩##VISTA##Qwen

매일 핵심 AI 소식을 한국어로, 빠르게

App Store 에서 Pulse 받기 앱에서 열기