연구진이 AI 생성 이미지 품질 평가(AIGIQA)를 위한 새로운 프레임워크 MST-CLIPIQA를 공개했어요. 기존 방식의 한계를 극복하기 위해 의미와 왜곡을 분리하는 다중 스케일 2스트림 구조를 사용했어요.
MST-CLIPIQA는 전반적인 의미 일관성을 파악하는 스트림과 미세한 텍스처와 왜곡 패턴을 보존하는 스트림을 활용하여 계층적 시각-언어 정렬을 달성해요.
5개 벤치마크 실험 결과, 품질 평가 SRCC 평균 1.11% 향상, 텍스트-이미지 대응 예측 SRCC 평균 2.35% 향상이라는 뛰어난 성과를 거두었어요.