ARTEMIS는 불완전하게 감독된 비디오 폴립 분할(VPS)을 위한 새로운 프레임워크입니다. 에이전트 기반으로 신뢰도와 시간적 일관성을 고려하여 마스크를 진화시킵니다.
SAM2를 활용하여 초기 마스크를 생성하고, 비전-언어 에이전트가 신뢰할 수 있는 시간적 앵커를 선택하여 마스크 품질을 개선합니다.
SUN-SEG 및 CVC-ClinicDB-612 데이터셋에서 스크리블, 포인트, 제한된 레이블 환경에서 최고 성능을 달성했습니다.
코드 공개는 GitHub에서 확인 가능합니다: https://github.com/wangtong627/ARTEMIS.