표준 확산 언어 모델은 KV 캐싱을 활용할 수 없고, 실용성을 위해 많은 개선 단계를 거쳐야 해요. CDLM은 훈련 후 레시피를 통해 정확한 블록 단위 KV 캐싱과 경로 일관성 있는 단계 감소를 가능하게 하여 문제를 해결했어요. 이로 인해 최대 14.5배의 지연 시간 개선 효과를 얻을 수 있었어요.