Anthropic이 RLM과 코딩 에이전트 기술을 결합한 Recursive Agent Harness (RAH) 패턴을 발표했어요. RAH는 파일 시스템 도구, 코드 실행, 계획 기능을 갖춘 에이전트 하니스를 재귀적으로 활용하는 방식이에요. GPT-5 기반으로 Oolong-Synthetic 벤치마크에서 코딩 에이전트 성능이 10% 향상됐으며, Claude Sonnet 4.5와 함께 사용 시 89.77%의 높은 성능을 달성했어요.
RAH는 부모 에이전트가 실행 가능한 스크립트를 생성하고, 이를 통해 세부 작업에 필요한 하니스를 병렬로 실행하며, 구조화된 함수 호출을 통해 작은 작업을 처리해요. 이를 통해 모델 재귀(RLM)의 한계를 극복하고 에이전트의 장기적인 추론 능력을 향상시킬 수 있어요.
연구진은 RAH가 모델 자체의 성능 향상보다는 에이전트 하니스의 효율성 증가에 기여한다고 분석했어요. RAH는 GPT-5 기반으로 71.75%에서 81.36%로 성능이 향상되었으며, Claude Sonnet 4.5와 함께 사용하면 더욱 높은 성능을 기대할 수 있어요.