Pulse · AI 뉴스

VLA 모델 제어: 안전한 언어 피드백 정책 학습

VLA · 2026-06-11

연구진은 VLA 모델의 언어 제어 성능을 개선하기 위한 프레임워크를 제안했어요. 이 프레임워크는 상호작용하며 성능을 개선하는 언어 시퀀스를 찾아 테스트 시간 언어 피드백 정책(LFP)을 구축하고, 성능 향상을 예측하는 개선 헤드를 학습해요.

LFP가 성능을 저하시키는 상황을 방지하기 위해 개선 헤드를 conformalize하여 안전성을 확보했어요. 시뮬레이션 환경에서 24.7%, 실제 로봇 환경에서 65.0% 성능 향상을 달성했어요.

본 프레임워크는 기존 VLA 모델을 수정하지 않고도 적용 가능하며, 시각적·의미적 변화에 대한 안전한 회복 동작을 보장해요.

##VLA##로봇제어##언어모델##피드백정책##안전성
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기