Pulse · AI 뉴스

SAID: 스캐폴드 기반 반복 디코딩으로 디퓨전 기반 언어 모델 가속화

LLaDA · 2026-06-03

연구진이 스캐폴드 기반 반복 디코딩 프레임워크 SAID를 제안했어요. SAID는 토큰별로 연산 자원을 재분배하여 디퓨전 기반 언어 모델(DLLM) 추론 속도를 높입니다. LLaDA-8B와 LLaDA 1.5 모델을 대상으로 한 실험에서 최대 9.1배의 속도 향상을 보였어요.

SAID는 먼저 스캐폴드 토큰에 연산 자원을 집중하여 대략적인 의미 구조를 확립하고, 예측 가능한 디테일 토큰은 더 적은 단계로 완성합니다.

코드와 모델은 GitHub에서 공개되었으며, 수학, 코딩, 지식 벤치마크에서 경쟁력 있는 성능을 유지하며 추론 속도를 크게 향상시켰습니다.

##디퓨전##언어모델##가속화##SAID##LLaDA
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기