ML-Bench는 14개 언어를 지원하는 정책 기반 다국어 안전성 벤치마크로, 지역별 규정을 직접 활용하여 문화적, 법적 맥락에 맞는 평가를 가능하게 합니다.
ML-Guard는 ML-Bench를 기반으로 개발된 Diffusion LLM 기반 가드레일 모델로, 다국어 안전성 판단 및 정책 기반 규정 준수 평가를 지원합니다.
ML-Guard는 빠른 안전/위험 판단을 위한 1.5B 경량 모델과 상세한 설명을 제공하는 7B 모델 두 가지 변형으로 제공되며, 기존 방법보다 우수한 성능을 보였습니다.