gabi-l-hart가 llama.cpp 프로젝트에 Granite4 Vision 모델을 공개했어요. 차트·표·키-값 쌍 추출 등 문서 추출 작업에서 뛰어난 성능을 보여줘요. 4B 파라미터로 경량화되어 더 큰 모델의 대안이 될 수 있어요.
차트 추출은 Chart2CSV, Chart2Summary, Chart2Code 형식으로 변환하고, 표 추출은 JSON, HTML, OTSL 형식으로 추출하며, 키-값 쌍 추출은 다양한 문서 레이아웃에서 수행돼요. 이 모델은 구조화된 문서 추출 작업에서 최첨단 성능을 제공해요.
4B 파라미터로 경량화되어 더 큰 모델을 대체할 수 있어, 리소스 제약이 있는 환경에서 유용하게 활용될 수 있을 것으로 기대돼요.