Pulse · AI 뉴스

LLM 금융 안전성 평가 벤치마크 FinSafetyBench 공개

FinSafetyBench · 2026-05-01

LLM이 금융 분야에 적용되면서 불법 행위 조장 등 유해한 결과물을 생성할 수 있다는 우려가 제기돼요.

연구진은 금융 규정 위반 요청 거부 능력을 테스트하는 이중 언어(영어, 중국어) 벤치마크 FinSafetyBench를 제안했어요.

실험 결과, 중국어 환경에서 LLM의 안전 취약성이 더 높게 나타났으며, 단순 프롬프트 방어 전략의 한계가 드러났습니다.

##LLM##금융##안전성##벤치마크##FinSafetyBench

매일 핵심 AI 소식을 한국어로, 빠르게