연구진은 시각-언어-행동(VLA) 모델의 실제 사용 시 발생할 수 있는 불안정성을 해결하기 위해 Pre-VLA라는 런타임 검증 아키텍처를 제안했어요.
Pre-VLA는 후보 행동의 안전성 신뢰도와 장점 점수를 예측하여 실제 실행이나 세계 모델 시뮬레이션 전에 행동의 유효성을 사전에 평가해요.
LIBERO 벤치마크 실험 결과, Pre-VLA는 평균 성공률을 30.79%에서 37.62%로 향상시키고, 작업 실행 단계를 줄이며, 세계 모델 시뮬레이션 오류 누적을 완화했어요.