두 명의 ML/CV 연구자가 arXiv cs.CV 분야 논문 검토자를 찾고 있어요. Locate-SAM2 프로젝트는 NVIDIA의 LocateAnything-3B와 Meta의 SAM 2.1을 연결하는 파이프라인을 구축했어요. RefCOCO 검증 데이터셋에서 0.772 mIoU를 달성하며 Grounding DINO Base (0.717)보다 성능이 향상됐어요. 논문 PDF와 GitHub 코드를 공유하며, 검토자의 엔도스먼트가 필요해요.
Locate-SAM2는 grounder 선택이 마스크 품질에 미치는 영향에 대한 질문에 답하기 위해 만들어졌어요. 어댑터를 통해 두 모델을 연결하고, 기존 모델의 성능을 개선하는 데 집중했어요. 논문에는 RefCOCO/+/g 비교, 어댑터 분석, 실패 분류, 그리고 넌센스 프롬프트 테스트 결과가 포함돼 있어요.