numind에서 문서 이해를 위한 통합 4B 비전-언어 추론 모델 NuExtract3을 공개했어요. 이 모델은 구조화된 정보 추출과 고품질 이미지-마크다운 변환을 결합합니다.
NuExtract3은 스캔, 영수증, 계약서, 테이블 등 다양한 문서의 추출 파이프라인, OCR, RAG 전처리 등에 활용할 수 있으며, 텍스트, 이미지 또는 텍스트와 이미지를 모두 입력으로 받을 수 있어요.
GGUF, NVFP4, MLX, VLLM 등 다양한 형식으로 제공되며, Hugging Face에서 모델을 확인할 수 있어요.