H사는 NVIDIA Nemotron 기반의 새로운 멀티모달 컴퓨터 사용 에이전트 'Holotron-12B'를 공개하며, 기존 모델 대비 추론 성능이 크게 향상됐다고 밝혔습니다.
Holotron-12B는 128K 컨텍스트를 지원하며, SSM(State-Space Model)과 어텐션 메커니즘을 결합한 하이브리드 아키텍처를 통해 높은 처리량을 제공합니다.
WebVoyager 벤치마크에서 Holotron-12B는 기존 모델보다 2배 이상의 처리량을 달성했으며, 에이전트 벤치마크에서도 우수한 성능을 보여줍니다. 모델은 Hugging Face에서 NVIDIA Open Model License로 제공됩니다.