Pulse · AI 뉴스

자신의 목소리에 맞춰 정렬하기: 환각 완화를 위한 자기 교정 선호 학습

arXiv cs.AI · 2026-04-27

대규모 시각-언어 모델(LVLM)은 종종 환각 현상을 겪어요.

AVES-DPO 프레임워크는 모델의 고유한 지식에서 파생된 분포 내 데이터로 LVLM을 정렬하여 분포 불일치 문제를 해결해요.

AVES-DPO는 기존 방법보다 환각 완화에 뛰어나고 5.2k개의 샘플만 필요로 해요.

##모델출시##환각##선호학습##AVESDPO

매일 핵심 AI 소식을 한국어로, 빠르게