IBM이 기업 문서 이해를 위한 소형 멀티모달 모델 'Granite 4.0 3B Vision'을 발표했습니다. 이 모델은 테이블 추출, 차트 이해, 키-값 쌍 추출에 특화되어 있습니다.
Granite 4.0 3B Vision은 ChartNet이라는 새로운 차트 이해 데이터셋과 DeepStack Injection이라는 시각적 특징 주입 기술을 활용하여 개발되었습니다.
이 모델은 LoRA 어댑터로 제공되어 기존 Granite 4.0 Micro 모델과 통합 가능하며, 차트 이해 벤치마크에서 Qwen3.5-9B보다 높은 성능을 보여주었습니다.