연구에 따르면 LLM 에이전트의 성능은 단순히 컴포넌트 수를 늘리는 것만으로 향상되지 않으며, 오히려 역효과가 발생할 수 있습니다.
HotpotQA와 GSM8K 데이터셋에서 모든 컴포넌트를 포함한 All-In 시스템보다 단순한 구성이 더 높은 성능을 보여주는 것으로 나타났습니다 (HotpotQA F1 0.233 vs 0.177, GSM8K 0.43 vs 0.24).
연구진은 컴포넌트 간 간섭(CCI)을 분석하고, 최적의 컴포넌트 수는 작업 유형과 모델 규모에 따라 달라진다는 사실을 밝혀냈습니다.