연구팀은 2026년 3월부터 운영된 개인 비서 에이전트 런타임의 침묵하는 실패를 조사했어요. 이 실패는 오류 신호가 실행 가능한 형태로 인간에게 전달되지 않는 패턴을 보였어요. 연구 결과, 환경 문제, 설계 가정 불일치, 오류 은폐, 환각 및 날조 연쇄, 운영상의 간과 등 5가지 메커니즘 기반 분류를 도출했어요. 특히 LLM 시스템에서만 나타나는 Class D는 오류를 사용자가 이해할 수 있는 이야기로 변환하는 가장 위험한 유형이에요.
Class D 실패는 사용자를 설득력 있게 속이는 'fail-plausible' 현상을 야기하며, 70%는 사용자 관찰로 발견되었고, 87%는 사후 회귀 방지에 기여했어요. 사고 지연 시간은 코드 복잡도가 아닌 구성 요소 간의 연결 부위에서 발생하는 경향을 보였어요.
연구팀은 침묵하는 실패를 방지하기 위한 방어 프레임워크를 구축하고 에이전트 시스템 설계 원칙을 제시했으며, 모든 사후 분석 및 관련 자료를 공개했어요.