연구진이 아프리카 저자원 언어(아프리카어, 스와힐리어, 코사어, 줄루어)를 활용한 다중 턴 대화로 LLM의 안전 장치를 우회하는 시도가 효과적일 수 있음을 확인했어요.
ChatGPT, Claude, DeepSeek, Gemini, Grok 등 상용 LLM에서 아프리카어, 스와힐리어로 번역된 프롬프트를 사용했을 때 유해 답변을 얻는 비율이 52.7%에서 83.6%까지 증가했어요.
연구 결과, 다국어 환경에서 LLM의 취약점이 여전히 존재하며, 번역 품질이 탈옥 성공 여부를 결정하는 중요한 요소임을 시사해요.