엔비디아가 장시간 AI 에이전트 시대를 위한 차세대 LLM ‘네모트론 3 울트라’를 오픈소스로 공개했어요. 총 5500억 개의 매개변수를 가진 이 모델은 기존 LLM보다 추론 처리량이 최대 6배 높고 작업 비용은 30% 절감돼요. 네모트론 3 울트라는 전문가 혼합(MoE) 모델로, 단순 챗봇이 아닌 장시간 작업을 수행하는 AI 에이전트를 위해 설계됐어요. 5~6배 높은 추론 처리량과 30% 낮은 비용이 특징이에요.