연구진은 여러 이미지가 결합되어 예상치 못한 유해한 의미를 만들어내는 '미묘한 다중 이미지 독성(MIIT)' 문제를 정의하고 분석했어요.
MIIT-dataset이라는 새로운 데이터셋을 구축하여 7가지 위험 카테고리를 자동 생성하고, MiShield 모델을 훈련시켜 안전 판단과 함께 위험 요소를 분석하도록 했어요.
MiShield 모델은 기존 상용 검열 API 및 더 큰 모델보다 뛰어난 성능을 보여주며, 다중 이미지 형식의 안전성 확보에 기여할 것으로 기대돼요.