Pulse · AI 뉴스

GeoSearcher: 원격 센싱 시각적 정렬을 위한 앵커 기반 점진적 추론

GeoSearcher · 2026-07-02

GeoSearcher는 원격 센싱 시각적 정렬(RSVG) 문제를 해결하기 위해 앵커 기반 점진적 추론 과정을 제안했어요. 기존 MLLM 기반 방법은 한 번의 좌표 생성을 통해 RSVG를 수행하지만, 작은 객체 위치 추정 및 복잡한 쿼리에 불안정성을 야기할 수 있어요.

ACR-SFT는 앵커 중심 추론 데이터를 활용해 모델이 핵심 시각적 단서를 앵커로 표현하고 위치, 관계, 속성 단서를 점진적으로 통합하도록 훈련해요. PF-GRPO는 Process-Aware Reward와 Reasoning-Informative Sample Selector를 통해 점진적 추론을 최적화해요.

GeoSearcher는 DIOR-RSVG, OPT-RSVG, VRS-Bench에서 기존 최고 성능 모델보다 뛰어난 성능을 보여줬어요. 프로젝트 코드는 GitHub에서 공개됐어요.

GeoSearcher는 대규모 시각적 검색을 더 제약된 지역 추론 과정으로 전환하여 RSVG의 정확도를 높이는 데 기여해요.

##원격센싱##시각적정렬##MLLM##GeoSearcher##인공지능
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기