NVIDIA가 Nemotron 3 Nano 30B-A3B 기반으로 구축된 독특한 디퓨전 기반 언어 모델 Nemotron-TwoTower-30B-A3B-Base-BF16을 공개했어요. 기존 방식과 달리, 이 모델은 고정된 오토리거시브 컨텍스트 타워와 디퓨전 디노이징 타워를 사용하여 토큰 블록을 병렬로 반복적으로 채워 넣어요.