elsung 사용자가 블랙웰 GPU (RTX 5090, 5080, 5070ti 등)를 위한 LLM 툴킷을 GitHub에 공개하여, 모델 설정 및 벤치마크 정보를 공유했어요.
Nemotron-3-Nano-Omni V3 모델을 NVFP4 양자화 방식으로 8K 컨텍스트에서 테스트했을 때 270 tok/s의 빠른 속도를 기록했으며, 멀티모달 기능을 지원해요.
DeepSeek-V4-Flash 모델은 65K 컨텍스트에서 31 tok/s의 속도를 보였고, MiniMax-M2.7 모델은 긴 컨텍스트 환경에서 높은 품질의 답변을 제공하며, 관련 벤치마크 결과는 GitHub 저장소에서 확인할 수 있어요.