NVIDIA가 새로운 Nemotron 3 Ultra 모델을 발표했어요. 이 모델은 128B 파라미터 규모로, 훈련 비용을 5배 절감하는 기술을 사용했어요. 연구자들은 이 모델을 통해 더 큰 규모의 언어 모델을 효율적으로 훈련할 수 있을 것으로 기대하고 있어요.