Pulse · AI 뉴스

Nemotron - 120B 모델 중 최고 성능?

Nemotron · 2026-06-15

Reasonable_Goat 사용자가 Nemotron Super 120B 모델의 뛰어난 깊은 컨텍스트 처리 성능을 공유했어요. 128GB 공유 메모리 환경에서 llama-bench 테스트를 진행한 결과, Nemotron은 GPT-OSS, Qwen 3.5, Qwen 3.6보다 깊은 컨텍스트에서 더 나은 성능을 보였어요. 특히, 32K 토큰 깊이에서 GPT-OSS를 능가하는 처리 속도를 보여줬어요.

Nemotron Super는 최대 400K 토큰 컨텍스트 깊이를 지원하며, 100K 토큰 깊이에서도 안정적인 성능을 유지하는 반면, GPT-OSS는 속도 저하가 심하고 Qwen 3.5 122B는 16K 깊이에서 이미 Nemotron에 뒤쳐져요. Qwen 3.6 35B는 최대 컨텍스트 깊이인 256K에서도 비슷한 수준의 처리 속도를 보여줘요.

Nemotron Super는 토큰 생성 속도(TG) 면에서는 Qwen 3.5 122B와 비슷한 수준이지만, 깊은 컨텍스트에서 안정적인 처리 성능을 제공하여 코드 분석 및 버그 수정 작업에 유용하며, 더 작은 Qwen 3.6 모델은 빠른 처리 속도가 필요한 경우 좋은 대안이 될 수 있어요.

##모델비교##Nemotron##llama-bench##컨텍스트
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기