Pulse · AI 뉴스

The Moving Eye: VLA 공간 일반화 성능 향상 방안 연구

Gr00t · 2026-07-03

연구진은 Vision-Language-Action(VLA) 모델의 공간 일반화 성능이 취약한 문제점을 지적했어요.

단순히 시점 수를 늘리는 것만으로는 해결되지 않으며, 모델이 피상적인 상관관계에 의존하는 단점(Shortcut Learning)이 발생할 수 있다고 밝혔어요.

연구진은 두 팔 로봇 시스템을 활용하여 카메라 움직임과 정적 시점을 결합한 하이브리드 데이터 전략이 피상적인 상관관계를 줄이고 학습 안정성을 유지하는 최적의 방법임을 확인했어요.

##VLA##로봇##공간인지##머신러닝##데이터

매일 핵심 AI 소식을 한국어로, 빠르게