에임인텔리전스가 다국어 환경에서 LLM의 안전성을 평가하는 벤치마크 'XL-세이프티벤치'를 공개했어요. 37개 LLM을 대상으로 10개국에서 5500개의 현지화 테스트를 거쳤다고 합니다. XL-세이프티벤치는 '현지 리스크 트랙'과 '문화적 민감성 트랙'으로 구성되어 각국의 법적·제도적·문화적 특수성을 반영해 LLM의 위험 대응 능력과 윤리적 판단 여부를 평가합니다.