Pulse · AI 뉴스

AtlasVA: 교사 없이 시각적 기술 기억을 자체 진화시키는 VLM 에이전트

AtlasVA · 2026-05-18

AtlasVA는 시각적 기술 기억을 자체 진화시키는 교사 없는 프레임워크입니다. 시공간적 의사 결정에 적합하도록 시각적 정보를 기반으로 공간 히트맵, 시각적 예제, 상징적 텍스트 기술을 활용합니다. Sokoban, FrozenLake, 3D 로봇 조작 벤치마크에서 기존 텍스트 기반 방식보다 우수한 성능을 보였어요.

AtlasVA는 경로 통계와 간단한 그리드 휴리스틱을 통해 위험 및 선호도 지도를 직접 진화시키고, 이를 강화 학습의 잠재력 기반 성형 보상으로 재사용합니다. 이를 통해 외부 LLM 감독 없이 인식, 기억, 최적화를 통합합니다.

3D 로봇 조작 벤치마크에서 특히 시공간적 작업에서 큰 성과를 거두며, 시각적 기반 기억의 중요성을 입증했어요.

##VLM##에이전트##강화학습
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기