MIPIAD는 영문과 방글라어를 대상으로 간접 프롬프트 주입 공격을 방어하는 프레임워크입니다. Qwen2.5-1.5B를 LoRA 방식으로 미세 조정하고 TF-IDF 어휘 특징을 결합하여 앙상블 학습을 진행했습니다.
합성 벤치마크를 통해 평가 결과, TF-IDF는 높은 성능(F1=0.77)을 보였으며, XLPID+TF-IDF 앙상블은 F1 0.9205, 부스팅 앙상블은 AUROC 0.9378의 최고 성능을 달성했습니다.
앙상블 방법은 영어-방글라 간의 언어적 격차를 줄이는 데 효과적이며, NLLB-200을 활용하여 200개 이상의 언어 지원이 가능합니다.