Pulse · AI 뉴스

APEX: 자율 정책 탐색을 통한 지속적 LLM 에이전트 진화

APEX · 2026-05-20

APEX는 LLM 에이전트의 지속적인 학습을 위한 자율 정책 탐색 기법입니다. 기존 방식의 탐색 실패 문제를 해결하기 위해 전략 맵을 구축하고, 미지의 영역을 탐색하는 Fork Discovery와 최적의 전략을 선택하는 Policy Selection을 활용합니다. Jericho 텍스트 어드벤처 게임과 WebArena 벤치마크에서 기존 방식보다 뛰어난 성능을 보여주며, 다양한 환경에서 효과적인 탐색을 가능하게 합니다.

##LLM##에이전트##탐색##APEX##자기진화
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기