GenAU는 이미지 감지, 픽셀 분할, 다중 유형 이상 감지, 결함 분석을 통합하는 비전-언어 프레임워크입니다.
GenAU는 두 개의 분할 토큰([SEG_defect], [SEG_normal])을 활용하여 픽셀 수준의 위치 정보를 제공하고, 이미지 수준 점수는 이 맵과 텍스트 결함/정상 여부 결정을 융합합니다.
GenAU는 기존 방법보다 뛰어난 이미지 수준 감지 성능을 보이며, VisA 및 Real-IAD 벤치마크에서 CLIP 기반 제로샷 방법 중 최고 성능을 달성했습니다.