Pulse · AI 뉴스

AnyGroundBench: 전문 분야 비디오 지오그래딩 벤치마크

AnyGroundBench · 2026-07-02

연구진이 비전-언어 모델(VLM)의 전문 분야 적응력을 평가하기 위해 AnyGroundBench라는 새로운 벤치마크를 공개했어요.

AnyGroundBench는 동물, 산업, 스포츠, 수술, 공공 안전 등 5가지 전문 분야의 비디오 데이터를 활용하여 기존 벤치마크의 한계를 극복하고자 설계됐어요.

15개의 최신 VLM을 평가한 결과, 전문 분야에서는 제로샷 및 인컨텍스트 학습(ICL) 모두 성능이 저하되는 문제점이 확인돼 향후 연구 방향을 제시했어요.

##비전언어모델##벤치마크##영상지오그래딩##도메인적응
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기