최근 LLM은 코딩 능력 향상으로 경쟁 프로그래밍부터 소프트웨어 엔지니어링까지 다양한 분야에서 두각을 나타내고 있어요.
코드 기반 에이전트 하니스는 LLM 에이전트의 추론, 액션, 환경 모델링, 실행 기반 검증을 위한 기반 인프라로 코드를 활용하는 새로운 관점을 제시해요.
본 서베이는 하니스 인터페이스, 메커니즘, 멀티 에이전트 시스템으로 확장하는 세 가지 레이어를 중심으로 코드 기반 에이전트 하니스를 체계적으로 연구하고 있어요.
향후 평가 방법론, 불완전한 피드백 환경에서의 검증, 안전한 액션 관리를 위한 인간 감독 등 하니스 엔지니어링의 과제를 제시하며, 실행 가능하고 검증 가능한 AI 에이전트 시스템 개발을 위한 로드맵을 제공해요.