연구진은 기존 확산 기반 추론 방식의 한계를 지적하며, 샘플마다 최적의 블록 크기가 다르다는 점에 주목했어요. BlockPilot은 프리필링 표현을 기반으로 최적의 블록 크기를 예측하는 샘플 적응형 정책으로, 가벼운 학습 방식으로 구현돼 효율적입니다. 실험 결과, BlockPilot은 기존 방식 대비 4.20배 빠른 속도를 달성하며, Qwen3-4B 모델에서 5.92의 수용 길이(acceptance length)를 보였어요.