Pulse · AI 뉴스

MIPIAD: 다국어 간접 프롬프트 주입 공격 방어 - Qwen 기반 TF-IDF 하이브리드 및 메타 앙상블 학습

Qwen · 2026-05-08

MIPIAD는 영문과 방글라어를 대상으로 간접 프롬프트 주입 공격을 방어하는 프레임워크입니다. Qwen2.5-1.5B를 LoRA 방식으로 미세 조정하고 TF-IDF 어휘 특징을 결합하여 앙상블 학습을 진행했습니다.

합성 벤치마크를 통해 평가 결과, TF-IDF는 높은 성능(F1=0.77)을 보였으며, XLPID+TF-IDF 앙상블은 F1 0.9205, 부스팅 앙상블은 AUROC 0.9378의 최고 성능을 달성했습니다.

앙상블 방법은 영어-방글라 간의 언어적 격차를 줄이는 데 효과적이며, NLLB-200을 활용하여 200개 이상의 언어 지원이 가능합니다.

##보안##프롬프트주입##Qwen##다국어##MIPIAD

매일 핵심 AI 소식을 한국어로, 빠르게