연구진은 LLM 기반 다중 에이전트 시스템(MAS) 라우팅의 보안 취약점을 지적하며, 기존 라우터가 에이전트의 역량을 평가하기 위해 텍스트 기반 정보에 의존하는 점을 문제로 꼽았습니다.
ANTAP(Automatic Non-Textual Agent Picker)는 에이전트의 실제 역량을 경험적으로 테스트하여 성능을 공유 의미 공간 내 고정된 행동 연산자로 변환하는 새로운 라우팅 아키텍처입니다.
ANTAP는 텍스트 기반 공격을 표현할 수 없도록 하는 '언어 방화벽'을 구축하며, 설명 기반 공격에 대한 ASR(Attack Success Rate)을 거의 0%로 낮추고, 임베딩 기반 공격에 대해서도 20% 감소시켰습니다.