연구진은 LLM 멀티 에이전트 시스템의 보안 취약점 대응을 위한 벤치마킹 플랫폼 GAMMAF를 개발했어요. GAMMAF는 실제 공격 시나리오를 반영한 합성 데이터셋을 생성하고, 기존 및 미래의 방어 모델 성능을 평가하는 데 사용돼요. 실험 결과, 효과적인 공격 대응은 시스템 무결성을 회복하고 불필요한 토큰 생성량을 줄여 운영 비용 절감에도 기여하는 것으로 나타났어요.