HarnessForge는 다양한 작업 환경에 적응하는 LLM 에이전트 시스템의 하니스와 정책을 공동으로 진화시키는 메타 적응 프레임워크입니다.
HarnessForge는 하니스 수준의 실행 구조와 정책 수준의 추론 행동을 분리하여 안정적인 적응 공간을 정의하고, 오류 지향적 하니스 조정 및 하니스 조건부 정책 정렬을 통해 공동 진화를 수행합니다.
다섯 가지 벤치마크 실험 결과, HarnessForge는 Qwen3-4B 및 Qwen3-8B 백본 모두에서 기존 하니스 또는 정책만 업데이트하는 방식보다 최대 12.0% 성능 향상을 보였습니다.