Pulse · AI 뉴스

NVIDIA, 550B 파라미터 Nemotron-3-Ultra 출시… 1M 토큰 맥락 처리

NVIDIA · 2026-06-04

NVIDIA가 Nemotron-3-Ultra-550B-A55B-BF16 모델을 공개했어요. 이 모델은 550B 파라미터와 55B 활성 파라미터를 가지고 있어요. Mamba-2와 MoE 레이어를 결합한 LatentMoE 아키텍처를 사용하며 최대 100만 토큰(1M) 맥락 처리가 가능해요. 영어, 프랑스어, 한국어 등 다양한 언어를 지원하며 상업적/비상업적 용도로 사용 가능해요.

복잡한 에이전트 워크플로우, 장문 컨텍스트 분석, 고정밀 추론에 최적화되었으며, 사용자의 질문에 대한 추론 과정을 먼저 생성하고 최종 답변을 제공하는 방식으로 작동해요. 사용자는 모델의 추론 기능을 챗 템플릿에서 설정할 수 있어요.

NVIDIA Nemotron은 오픈 웨이트, 학습 데이터, 레시피를 제공하는 오픈 모델 제품군으로, 전문 AI 에이전트 구축에 필요한 효율성과 정확도를 높이는 데 목표를 두고 있어요. 8x GB200/B200/GB300/B300 또는 16x H100, 8x H200 GPU 환경에서 실행 가능해요.

##NVIDIA##LLM##Nemotron##모델출시##Mamba
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기