Pulse · AI 뉴스

다중 모드 LLM 평가 시 지각적 판단 편향 완화: 지각적 교란 및 보상 모델링을 통해

Mitre · 2026-06-01

연구진은 다중 모드 LLM이 시각적 증거와 텍스트 단서가 충돌할 때, 지각적으로 정확한 답변보다 그럴듯한 이야기를 옹호하는 '지각적 판단 편향'을 보이는 것을 확인했어요.

지각적 교란을 통해 최소한으로 편집된 반사실적 응답으로 구성된 '지각적 교란 판단 데이터셋'을 구축하고, 이를 기반으로 GRPO 기반 보상과 배치 순위 객관식을 결합한 훈련 프레임워크를 개발했어요.

다양한 MLLM-as-a-Judge 벤치마크에서 실험 결과, 지각적 정확성, 순위 일관성, 인간 평가와의 일치도가 크게 향상된 것으로 나타났어요.

##LLM##다중모드##평가##편향##지각
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기