SpanVLA는 VLM의 시각 및 추론 지침을 활용하여 흐름 매칭 정책을 통해 미래 경로를 효율적으로 계획하는 브리지를 도입하여 추론 시간을 단축하는 새로운 자율 주행 프레임워크입니다.
GRPO 기반의 후처리 방법을 통해 SpanVLA 모델이 긍정적인 주행 샘플뿐만 아니라 일반적인 부정적 행동을 피하고 회복 행동을 학습하도록 하여 성능과 강건성을 향상시켰습니다.
NAVsim(v1 및 v2)에서의 광범위한 실험 결과, SpanVLA 모델은 경쟁력 있는 성능을 보여주었으며, 다양한 시나리오에서의 질적 결과는 모델의 계획 성능과 강건성을 강조합니다.