Pulse · AI 뉴스

ReGRPO: 도구 사용 에이전트의 오류 수정 능력 향상

ReGRPO · 2026-06-30

ReGRPO는 도구 사용 에이전트의 오류 수정 능력을 향상시키는 프레임워크입니다. 실패한 시나리오를 반영하여 오류 유형, 증거, 수정 계획을 학습합니다.

실패한 단계와 수정 방법을 파악하기 위해 그룹 상대적 이점을 활용하여 반사 토큰과 수정 작업을 공동으로 최적화합니다.

GTA와 GAIA 실험에서 ReGRPO는 기존 오픈 소스 모델보다 뛰어난 성능을 보였습니다. 코드와 RoT 데이터는 GitHub에서 확인할 수 있습니다.

##에이전트##도구##오류수정##ReGRPO##OpenSource
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기