Pulse · AI 뉴스

Route to Rome 공격: 적대적 접미사 최적화를 통한 고가 모델 LLM 라우터 조작

arXiv cs.CL · 2026-04-16

본 연구는 LLM 라우터를 조작하여 의도적으로 고가의 모델을 선택하도록 유도하는 새로운 공격 기법인 R$^2$A를 제안합니다.

R$^2$A는 블랙박스 라우터를 모방하는 앙상블 서로게이트 라우터를 활용하고, 적대적 접미사 최적화 알고리즘을 적용하여 공격을 수행합니다.

실험 결과, R$^2$A는 다양한 오픈소스 및 상용 라우팅 시스템에서 고가 모델로의 라우팅 비율을 현저히 증가시키는 것을 확인했습니다.

##모델보안##적대적공격##라우팅

매일 핵심 AI 소식을 한국어로, 빠르게