연구진은 자율 주행의 안전을 위해 도로 구조와 언어를 결합하는 Combined Road Substrate (CRS) 프레임워크를 개발했어요. CRS는 도로의 기하학적 구조와 자유로운 어휘의 의미를 하나의 표현 방식으로 결합하여 복잡한 질문-답변 쌍을 생성하고 논리적 추적성을 보장해요. CRS를 활용한 훈련은 기존 VLM의 약점을 보완하고, 모델 규모가 아닌 구조화된 감독 학습의 부재가 주된 병목 현상임을 보여줬어요.