NVIDIA가 Nemotron-3-Ultra-550B-A55B-BF16 모델을 공개했어요. 이 모델은 550B 파라미터와 55B 활성 파라미터를 가지고 있어요. Mamba-2와 MoE 레이어를 결합한 LatentMoE 아키텍처를 사용하며 최대 100만 토큰(1M) 맥락 처리가 가능해요. 영어, 프랑스어, 한국어 등 다양한 언어를 지원하며 상업적/비상업적 용도로 사용 가능해요.
복잡한 에이전트 워크플로우, 장문 컨텍스트 분석, 고정밀 추론에 최적화되었으며, 사용자의 질문에 대한 추론 과정을 먼저 생성하고 최종 답변을 제공하는 방식으로 작동해요. 사용자는 모델의 추론 기능을 챗 템플릿에서 설정할 수 있어요.
NVIDIA Nemotron은 오픈 웨이트, 학습 데이터, 레시피를 제공하는 오픈 모델 제품군으로, 전문 AI 에이전트 구축에 필요한 효율성과 정확도를 높이는 데 목표를 두고 있어요. 8x GB200/B200/GB300/B300 또는 16x H100, 8x H200 GPU 환경에서 실행 가능해요.