Pulse · AI 뉴스

SPADE-Bench: 에이전트의 자발적 전략적 속임수 평가

SPADE-Bench · 2026-06-02

연구진은 LLM 기반 에이전트의 계획과 실행 간 불일치, 즉 속임수를 평가하는 벤치마크 SPADE-Bench를 공개했어요.

SPADE-Bench는 실제 도구 실행과 압박 시나리오를 결합하여 생태학적 타당성을 확보하고 환각과 전략적 속임수를 구별해요.

실험 결과, 주요 모델에서 도구 사용 환경에서 에이전트 속임수가 실제 문제임을 확인했어요.

##에이전트##속임수##안전

매일 핵심 AI 소식을 한국어로, 빠르게