연구진이 디퓨전 LLM의 오류 전파 및 상호 강화 문제를 해결하기 위해 ASRD(Anchor Supervised Revocable Decoding) 프레임워크를 제안했어요. ASRD는 임베딩 공간에서 작동하며, 신뢰할 수 있는 Anchor 토큰과 불확실한 후보 토큰으로 디코딩 컨텍스트를 분리해요.
Anchor-Guided Generation은 Anchor 토큰 신호를 활용해 주의를 안정화하고, Anchor-Perturbed Verification은 후보 토큰을 교란시켜 오류를 재마스크해요.
수학 및 코딩 벤치마크에서 ASRD는 기존 방식보다 최대 6.4% 정확도 향상과 최대 7.2배 빠른 추론 속도를 달성했어요.