Google DeepMind의 Gemini와 Alibaba의 Qwen이 나이지리아 환경에서 가장 뛰어난 성능을 보였습니다. 기존 YOLO+OCR 방식 대비 자원 요구량이 적고, 데이터셋 구축 부담이 적다는 장점이 있습니다. 연구 결과는 모델 제공사의 성능 주장을 의심하게 하고, 다양한 VLM의 성능을 비교합니다.