Pulse · AI 뉴스

시각적 지침 기반 로봇 제어: GTA-VLA 프레임워크

GTA-VLA · 2026-05-13

연구팀은 사용자의 시각적 지침을 반영하여 로봇의 공간 추론 능력을 향상시키는 GTA-VLA 프레임워크를 제안했습니다.

GTA-VLA는 사용자가 로봇 정책에 시각적 단서를 제공하여 공간적으로 제어 가능한 임베디드 추론을 가능하게 합니다.

SimplerEnv WidowX 벤치마크에서 81.2%의 성공률을 달성했으며, 시각적 변화 및 공간적 모호함 상황에서 기존 방법보다 뛰어난 성능을 보였습니다.

##로봇제어##임베디드AI##시각적추론##VLA
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기