Pulse · AI 뉴스

CoEvolve: LLM 에이전트와 데이터의 상호 진화 훈련 방식

Qwen · 2026-04-17

CoEvolve는 LLM 에이전트의 행동 변화에 적응하지 못하고 복잡한 환경 상호작용을 제대로 커버하지 못하는 기존 강화 학습의 한계를 극복하기 위해 개발된 프레임워크입니다.

에이전트의 롤아웃 트래저토리에서 망각과 불확실성과 같은 피드백 신호를 추출하여 실패 가능성이 높은 상호작용 패턴을 식별하고, 이를 바탕으로 LLM 기반 작업 합성을 가이드합니다.

AppWorld와 BFCL 환경에서 Qwen2.5-7B, Qwen3-4B, Qwen3-30B-A3B 모델을 사용하여 실험한 결과, 기존 모델 대비 각각 19.43%, 15.58%, 18.14%의 성능 향상을 달성했습니다.

##에이전트##강화학습##Qwen

매일 핵심 AI 소식을 한국어로, 빠르게