Pulse · AI 뉴스

엔비디아, 자체 최고 성능 ‘네모트론 3 울트라’ 출시…“비용 30% 절감”

NVIDIA · 2026-06-05

엔비디아가 장시간 AI 에이전트 시대를 위한 차세대 LLM ‘네모트론 3 울트라’를 오픈소스로 공개했어요. 총 5500억 개의 매개변수를 가진 이 모델은 기존 LLM보다 추론 처리량이 최대 6배 높고 작업 비용은 30% 절감돼요.

네모트론 3 울트라는 전문가 혼합(MoE) 모델로, 단순 챗봇이 아닌 장시간 작업을 수행하는 AI 에이전트를 위해 설계됐어요. 5~6배 높은 추론 처리량과 30% 낮은 비용이 특징이에요.

##엔비디아##LLM##AI에이전트

매일 핵심 AI 소식을 한국어로, 빠르게