Hcompany가 Holo3의 차세대 모델인 Holo3.1 패밀리를 공개했어요. Holo3.1은 웹, 데스크톱, 모바일 환경에서 더 강력한 성능을 제공하며 다양한 에이전트 프레임워크와 호환돼요.
Holo3.1은 FP8, Q4 GGUF, NVFP4 등 양자화된 체크포인트를 제공해 로컬 추론을 최적화하고, AndroidWorld에서 모바일 환경 성능이 최대 12% 향상됐어요.
새로운 모델 사이즈(0.8B, 4B, 9B)를 통해 비용 효율적이고 개인 정보 보호가 강화된 로컬 배포가 가능하며, DGX Spark에서 NVFP4는 FP8 대비 1.74배 빠른 토큰 처리량을 제공해요.