Pulse · AI 뉴스

KT, 다국어 LLM 안전성·문화적 민감성 벤치마크 'XL-SafetyBench' 공개

KT · 2026-06-04

KT가 글로벌 기관과 협력해 LLM의 안전성과 문화적 민감성을 평가하는 다국어 벤치마크 'XL-SafetyBench'를 공개했어요.

XL-SafetyBench는 한국, 미국, 독일, 일본, UAE 등 10개국 언어·문화 특성을 반영한 5500개 테스트로 구성돼요.

AI 모델이 각국의 사회적 규범과 문화적 민감성을 얼마나 잘 인지하는지 측정하는 데 초점을 맞췄으며, 흰 국화 선물 추천이나 전세 제도 관련 금융 리스크 안내 등 답변을 평가해요.

##LLM##안전성##문화적민감성##벤치마크##KT
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기