최근 연구에 따르면 CLIP 비전 트랜스포머와 같은 대규모 사전 훈련 모델을 특징 추출기로 사용할 때, 새로운 생성 모델에서 AI 생성 이미지를 효과적으로 탐지할 수 있어요.
연구진은 다양한 비전 파운데이션 모델(VFM)들을 포괄적으로 벤치마크하여 AI 생성 이미지 및 AI 이미지 인페인팅 탐지 성능을 평가했어요.
최신 VFM에 튜너블 어텐션 풀링(TAP)을 통합하면 여러 AI 생성 이미지 탐지 벤치마크에서 상당한 성능 향상을 얻을 수 있으며, 새로운 최고 성능을 달성했어요.