Llama.cpp가 Nvidia Blackwell GPU의 PDL(Programmatic Dependent Launch) 기능을 지원하게 됐어요. PDL은 커널 실행 효율성을 높여 전반적인 성능을 향상시키는 기술이에요. 현재는 기본적으로 활성화되어 있지 않아, '-D GGML_CUDA_PDL=ON' 플래그로 빌드해야 적용 가능해요.
Blackwell GPU에서 Qwen 3.6 35B 모델을 사용할 때 토큰 생성 속도가 평균 5~6% 향상되는 것으로 확인됐어요. Nvidia의 예상치인 4~10% 향상 범위에 부합하는 결과예요.
Blackwell GPU 사용자라면 별도의 비용 없이 PDL를 활성화하여 성능 향상을 경험할 수 있어요.