연구진은 LLM 대화형 시스템의 능동적인 상호작용을 위한 다음 쿼리 예측 기술 OnePred을 제안했어요. OnePred은 사용자의 의도 경로를 추적하는 재귀적 메모리를 활용하여 대화 길이에 상관없이 토큰 소비를 제한해요. 새로운 벤치마크 NQP-Bench를 통해 OnePred은 기존 방식보다 토큰 소비를 최대 22배 줄이면서 예측 품질을 향상시켰어요.