연구진은 LLM 에이전트의 한계를 극복하기 위해 능동적 실험을 통한 자가 개선 프레임워크인 HExA를 공개했어요.
HExA는 실험을 설계하고, 재사용 가능한 기술 라이브러리를 구축하며, 실험 결과를 통합해 복잡한 문제 해결에 활용돼요.
Interphyre 벤치마크에서 Claude Sonnet 4.6의 성공률을 2%에서 77%로 향상시키고, 기존 에이전트 방식보다 뛰어난 성능을 보여줬어요.
HExA는 학습 데이터 없이 작동하며, 검은 상자 모델과 호환되고 외부 감독이나 오라클이 필요 없다는 장점이 있어요.