LongSeeker는 장기 검색 에이전트가 작업 컨텍스트를 효율적으로 관리할 수 있도록 돕는 새로운 패러다임입니다. Context-ReAct라는 프레임워크를 통해 에이전트는 Skip, Compress, Rollback, Snippet, Delete 등의 연산을 활용하여 컨텍스트를 동적으로 재구성합니다.
LongSeeker는 Qwen3-30B-A3B 모델을 기반으로 1만 개의 합성 경로로 파인튜닝되었으며, BrowseComp 및 BrowseComp-ZH 벤치마크에서 각각 61.5%, 62.5%의 높은 성능을 기록했습니다.
연구 결과는 에이전트가 작업 메모리를 능동적으로 관리함으로써 더 안정적이고 효율적인 장기 추론을 달성할 수 있음을 보여줍니다.