연구진은 기존 블록 기반 디퓨전 LLM의 비효율성을 지적하며, 버려지는 토큰에 남아있는 맥락 정보가 후속 디코딩에 유용하다는 점을 발견했어요. Residual Context Diffusion (RCD) 모듈을 제안하여, 버려진 토큰의 계산을 재활용함으로써 디퓨전 LLM의 효율성을 높였어요. RCD는 기존 방식 대비 더 나은 성능을 보이며, 계산 비용을 절감하는 데 기여할 것으로 기대돼요.