DSpark는 추론 속도를 높이는 새로운 기술로, LLM의 speculative decoding 방식을 개선했어요. 기존 방식보다 2배 빠른 속도를 보이며, 특히 긴 시퀀스 추론에서 효과적이에요. 연구 결과는 pdf 파일로 공개됐습니다. DSpark는 LLM의 활용도를 높이고, 더 복잡한 작업도 빠르게 처리할 수 있도록 기여할 것으로 기대돼요.