Pulse · AI 뉴스

RotVLA: 로봇 제어를 위한 회전 기반 잠재 액션 모델

RotVLA · 2026-05-13

RotVLA는 시각-언어-액션(VLA) 모델에서 이질적인 데이터셋을 처리하기 위해 연속적인 회전 기반 잠재 액션 표현을 사용하는 새로운 프레임워크입니다. 기존 방식의 이산적인 양자화 방식을 개선하여 물리적으로 의미 있는 구조를 갖도록 설계되었으며, 1700시간 이상의 데이터로 사전 훈련되었습니다.

RotVLA는 LIBERO에서 98.2%, RoboTwin2.0에서 89.6% / 88.5%의 성능을 달성하며, 기존 VLA 모델보다 뛰어난 실세계 조작 성능을 보여줍니다.

잠재 액션은 고수준의 지침을 제공하는 잠재적인 플래너 역할을 하며, 액션 생성에 영향을 미칩니다. 이 모델은 17억 개의 파라미터와 1700시간 이상의 사전 훈련 데이터로 구성되어 있습니다.

##로봇제어##VLA##잠재액션##회전변환
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기