연구진은 LLM 에이전트의 하네스를 학습 가능한 모듈로 자동 생성하는 방법인 HarnessBridge를 제안했어요. HarnessBridge는 에이전트와 환경 간 상호작용을 양방향 투영으로 표현하여 관찰 투영과 행동 투영을 학습합니다. Terminal-Bench~2.0과 SWE-bench Verified에서 기존 하네스 성능을 능가하며 토큰 사용량과 경로 길이를 줄였어요.
HarnessBridge는 관찰 투영을 통해 원시 경로를 압축하고, 행동 투영을 통해 제안된 행동을 실행 가능한 전환 또는 경로 기반 거부로 변환합니다. 연구진은 통합된 지시 튜닝을 통해 하네스 감독 데이터셋으로 HarnessBridge를 학습했어요.
HarnessBridge는 작은 생성기에서 대형 상용 모델로의 일반화 능력을 보여주며, 기존 하네스보다 뛰어난 성능을 발휘하며 토큰 사용량과 경로 길이를 줄이는 효과를 보였어요.