연구에 따르면 도구 활용 언어 모델 에이전트는 올바른 도구를 선택하고 유효한 API 인수를 생성하며 요청된 작업을 완료하는지 여부로 평가받습니다.
하지만 에이전트는 올바른 도구를 선택하더라도 잘못된 외부 엔티티에 작용할 수 있으며, 예를 들어 'Alex에게 출시 이메일 보내기' 요청이 잘못된 Alex에게 전달될 수 있습니다.
연구진은 이러한 오류를 '엔티티 바인딩 오류'라고 명명하고, 엔티티 바인딩 오류를 도구 활용 에이전트의 신뢰성과 안전 문제로 공식화했습니다.
실험 결과, 엔티티 인식 방법은 잘못된 엔티티 작용을 제거하고 모호성으로 인한 작업 완료 지연을 줄이는 데 효과적이었지만, 기존 방식으로는 24~26%의 오류가 발생했습니다.