연구진이 디퓨전 언어 모델(dLLM)에 적용 가능한 추론 기법 SimSD(Simple Speculative Decoding)를 제안했어요. SimSD는 기존 디퓨전 모델의 마스크 토큰과 양방향 어텐션 문제를 해결하여 토큰 단위의 추론 검증을 가능하게 해요. SimSD는 별도의 학습 없이 기존 디퓨전 모델에 적용 가능하며, 최대 7.46배 빠른 추론 속도를 달성하면서도 생성 품질을 유지하거나 향상시켰어요.