연구진이 다양한 이미지 도메인과 작업을 포괄하는 시각적 인-컨텍스트 벤치마크(VIBE)를 구축하여 시각적 인-컨텍스트 모델의 적응 능력을 평가했습니다. 6개의 모델을 14개 데이터셋과 12개 작업(총 106개 조합)에서 테스트한 결과, 기존 모델의 한계와 실패 모드, 유망한 발전 방향을 확인했습니다. 연구진은 VIBE 툴킷을 공개하여 더 광범위한 평가를 장려하고, 시각적 인-컨텍스트 학습 분야의 발전에 기여할 것으로 기대됩니다.