AtlasVA: 교사 없이 시각적 기술 기억을 스스로 진화시키는 VLM 에이전트 프레임워크
AtlasVA · 2026-05-18
AtlasVA는 시각적 기술 기억을 스스로 진화시키는 교사 없는 프레임워크로, 공간적 의사 결정에 적합하도록 시각적으로 기반한 기억을 사용합니다. 공간 히트맵, 시각적 예제, 상징적 텍스트 기술의 세 가지 층으로 기억을 구성하고, 위험 및 선호도 지도를 스스로 진화시킵니다. Sokoban, FrozenLake, 3D 임베디드 내비게이션, 3D 로봇 조작 벤치마크에서 기존 텍스트 기반 방식보다 우수한 성능을 보였습니다.