연구진은 LLM 에이전트의 무인 운영 시 발생하는 허위 성공 문제를 해결하기 위해 Goal-Autopilot을 개발했어요.
Goal-Autopilot은 실행 모델을 외부화하여 에이전트가 실제로 검증하지 않은 성공을 보고하는 것을 원천적으로 차단하며, 'No-False-Success' 정리를 통해 안전성을 보장해요.
SWE-bench Lite 테스트에서 StateFlow 대비 허위 성공률을 33.07%p 감소시켰으며, 모든 10건의 허위 성공은 가장 강력한 모델에서 발생했어요.