연구진은 LLM 에이전트 루프의 반복 횟수를 고정하는 방식의 한계를 지적하며, 의미론적 조기 종료 기법을 제안했어요.
의미론적 조기 종료는 초안 임베딩의 의미 변화가 멈추고 답변 품질이 향상되지 않을 때 루프를 종료하는 방식이에요.
실험 결과, 판단자 없이 의미론적 조기 종료를 적용하면 토큰 사용량을 38% 줄일 수 있었으며, 최적의 라운드를 선택하는 오라클은 기존 방식보다 정보 점수가 0.115점 높았어요.
본 연구는 반복 LLM 에이전트 루프의 문제 해결 시점을 '언제 멈출까'에서 '어떤 라운드가 최적인가'로 재정의했어요.