PrefixGuard는 LLM 에이전트의 오류를 실시간으로 감지하기 위한 새로운 프레임워크입니다. 이 시스템은 실행 추적을 분석하여 오류 발생 가능성을 예측하고, 이를 바탕으로 사용자에게 경고를 제공합니다.
StepView라는 오프라인 단계를 통해 실행 추적에서 유형화된 어댑터를 유도하고, 모니터는 최종 결과로부터 이벤트 추상화 및 접두사 위험 점수기를 학습합니다.
WebArena, $τ^2$-Bench, SkillsBench, TerminalBench 4가지 벤치마크에서 PrefixGuard는 기존 방식보다 평균 +0.137 AUPRC 향상된 성능을 보였습니다.