본 연구는 LLM의 장문 생성 시 발생하는 불안정성을 측정하고 완화하는 데 초점을 맞추고 있습니다.
VOLTBench라는 새로운 벤치마크를 제안하여 장문 생성의 길이 불안정성을 체계적으로 정량화하고, 주의 집중 패턴 분석을 통해 불안정성의 원인을 파악했습니다.
GLoBo라는 경량화된 디코딩 최적화 전략을 통해 장문 생성의 길이 정확성과 안정성을 향상시켰으며, 실험 결과 평균 출력 길이를 148% 향상시키고 길이 불안정성을 69% 감소시켰습니다.