SemBlock은 디퓨전 LLM의 효율적인 텍스트 생성 블록 크기 조절 프레임워크입니다. 의미적 경계를 예측하는 경량 예측기를 활용하여 고정된 블록 크기의 한계를 극복합니다. SemBound 데이터셋을 활용하여 자연어, 수학, 코드 등 다양한 작업에서 의미적 경계를 학습했습니다.
GSM8K, IFEval, MATH, HumanEval 데이터셋 실험 결과, 기존 방식 대비 성능 향상을 보였습니다. AdaBlock 방식보다도 더 나은 성능을 보여줍니다. 코드는 GitHub에서 공개되어 있습니다.