엔비디아가 자기회귀 언어모델의 한계를 극복하기 위한 하이브리드 확산 모델 '네모트론 랩스 투타워'를 공개했어요. 이 모델은 기존 모델 성능을 유지하면서 텍스트 생성 속도를 최대 2.42배 향상시켰다고 합니다. 모델 가중치와 소스 코드는 허깅페이스를 통해 공개되어 연구 및 산업계에서 자유롭게 활용할 수 있어요.
네모트론 랩스 투타워는 기존 자기회귀 모델의 속도 제한을 해결하기 위해 개발되었으며, 성능은 기존 모델 대비 98.7% 수준을 유지하며 빠른 속도를 제공합니다. 엔비디아는 이 모델을 온라인 아카이브에 공개하고, 허깅페이스를 통해 가중치와 소스 코드를 공유했어요.