NVIDIA가 Blackwell GPU에서 DFlash 추론 기술을 통해 LLM 추론 속도를 최대 15배 향상시켰다고 발표했어요. DFlash는 LLM의 다음 단어를 예측하는 데 사용되는 추론 속도를 높이는 기술이에요. Blackwell GPU는 기존 Hopper GPU 대비 2배 더 빠른 추론 속도를 제공하며, DFlash 기술을 통해 더욱 성능을 끌어올렸어요. 이 기술은 복잡한 멀티 에이전트 워크플로우에 적합하도록 설계됐어요.