연구진이 이미지 생성 모델의 정렬 실패 모드를 분석한 ICML 2026 논문이 공개됐어요. 모델이 사용자의 의도와 반대되는 미적 선호도를 학습해 의도치 않은 결과물을 생성할 수 있다는 내용이에요.
논문은 이러한 현상을 '역정렬'로 명명하고, 흐릿하거나 왜곡된 이미지 생성 시 이러한 문제가 발생함을 확인했어요. GitHub 저장소에서 관련 코드를 확인할 수 있어요.
연구진은 프롬프트 이해와 선호도 무시 현상을 분리하는 평가 설계에 대한 피드백을 구하고 있으며, 논문은 arXiv에 공개됐어요.