본 논문에서는 운전 시뮬레이션 환경에서 자연어 추론 인터페이스의 한계를 극복하기 위해 메타 액션이라는 간결한 단계를 활용하는 DriveMA 모델을 제안합니다.
메타 액션은 기존 추론 방식보다 직관적이고 효율적이며, 전문가의 주행 경로에서 자동으로 파생될 수 있어 확장 가능한 감독 학습을 가능하게 합니다.
DriveMA는 2B 모델로 Waymo End-to-End Driving Challenge에서 RFS 8.060을 달성하고, 4B 모델로 8.079까지 성능을 향상시키는 등 새로운 최고 기록을 세웠습니다.
제안하는 메타 액션은 표현력, 예측 가능성, 추론 효율성 측면에서 자연어 추론이나 세분화된 액션 시퀀스보다 우수한 성능을 제공합니다.