S1-VL은 과학 분야의 복잡한 추론을 위해 개발된 멀티모달 모델로, 체계적인 사고 과정과 이미지 조작을 결합하는 새로운 방식을 도입했어요.
이 모델은 Python 코드를 통해 이미지를 처리하고 분석하며, 여러 단계의 반복적인 추론을 수행하여 고해상도 차트 해석, 현미경 이미지 이해, 기하학적 추론 등 어려운 문제 해결에 효과적이에요.
S1-VL은 수학, 물리학, 화학 등 6개 과학 분야의 데이터를 활용하여 학습되었으며, 13개의 벤치마크에서 최고 성능을 달성했어요.