연구진이 스캐폴드 기반 반복 디코딩 프레임워크 SAID를 제안했어요. SAID는 토큰별로 연산 자원을 재분배하여 디퓨전 기반 언어 모델(DLLM) 추론 속도를 높입니다. LLaDA-8B와 LLaDA 1.5 모델을 대상으로 한 실험에서 최대 9.1배의 속도 향상을 보였어요.
SAID는 먼저 스캐폴드 토큰에 연산 자원을 집중하여 대략적인 의미 구조를 확립하고, 예측 가능한 디테일 토큰은 더 적은 단계로 완성합니다.
코드와 모델은 GitHub에서 공개되었으며, 수학, 코딩, 지식 벤치마크에서 경쟁력 있는 성능을 유지하며 추론 속도를 크게 향상시켰습니다.