Pulse · AI 뉴스

계획이 사라지는 이유: LLM 에이전트의 컨텍스트 관리가 핵심

Llama · 2026-06-22

연구에 따르면 LLM 에이전트는 장기 과제 수행을 위해 컨텍스트 관리를 사용하지만, 계획은 초기에 작성되고 여러 단계에서 사용되므로 가장 먼저 삭제되는 스트레스 케이스입니다.

replay pairing 진단법을 통해 Llama-3.1-70B에서 계획 신호가 계획 작성 후 한 단계에서 0.453으로 급증했지만, 단일 액션-관찰 단계에서 4.1배 감소하는 것을 확인했습니다.

연구진은 reasoning-trace confound를 해결하기 위해 strict stripping을 적용하고, 컨텍스트에 남아있는 계획 정보를 복구했으며, DeepSeek-R1-Distill-Llama-70B에서 Llama 훈련된 probe가 AUROC 0.748로 전이되는 것을 확인했습니다.

naive 계획 삭제는 ALFWorld 성공률을 34.7pp 감소시키지만, probe-gated re-surfacing으로 복구하지 못하며, 이는 에이전트에게 중요한 정보가 컨텍스트에 남아있음을 보여줍니다.

##LLM##에이전트##컨텍스트##계획
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기