Pulse · AI 뉴스

NVIDIA DVLT 모델 위한 CUDA/C++ 추론 엔진 'dvlt.cu' 출시

NVIDIA · 2026-06-07

연구자가 NVIDIA의 DVLT 3D 트랜스포머 모델을 위한 추론 엔진 'dvlt.cu'를 개발했어요. 이 엔진은 5MB 단일 바이너리로, Python, PyTorch, TensorFlow 등 런타임 의존성 없이 작동해요. mmap'd BF16 가중치를 사용하고, GPU에 한 번 업로드하여 정적 차원을 활용하는 방식으로 작동하며, 사용 편의성을 높였어요.

##CUDA##3D##NVIDIA##DVLT
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기