Domino는 autoregressive drafting을 분리하여 추론 속도를 높이는 새로운 방식입니다. Qwen3 모델에서 최대 5.8배의 throughput 속도 향상을 보여줬어요.