새로운 연구에서 실시간 상호작용을 위한 에이전트 구축 방안을 제시했어요. 핵심은 LLM의 추론과 도구 호출 과정을 분리하여 외부 대기 시간을 단축하는 비동기 I/O 기술이에요. 사용자 정보가 불확실할 때, 예측적 도구 호출을 통해 작업 실행을 관리하며 정확도를 유지해요. Qwen2.5-3B-Instruct 및 Llama-3.2-3B-Instruct 모델에서 최대 2.2배 속도 향상을 달성했어요.