LLM 기반 에이전트가 외부 도구와 상호작용하며 복잡한 문제를 해결하면서 에이전트 행동 검증, 디버깅, 감사가 어려워지고 있어요.
증거 추적과 실행 출처 추적은 에이전트 실행 과정에서 사용된 증거, 도구 출력, 메모리 항목, 환경 관찰, 중간 주장, 행동, 최종 답변 간의 연결을 모델링하여 이 문제를 해결해요.
본 연구는 증거 추적과 실행 출처 추적에 대한 체계적인 검토와 개념적 프레임워크를 제시하고, 검색 기반 근거, 도구 사용 안전, 메모리 계보, 관찰 가능성, 디버깅, 감사, 복구 등을 아우르는 통일된 관점을 제시해요.
향후 과제로 통일된 추적 스키마, 의미 기반 추적, 개인 정보 보호 감사 인프라 등을 제시하며, 평가가 최종 답변 정확성에서 프로세스 수준 책임감으로 이동해야 함을 강조해요.