Pulse · AI 뉴스

새로운 시각으로 사고하기: 생성형 모델을 활용한 공간 지능 연구

arXiv cs.CV · 2026-05-11

연구진은 LMM의 공간 추론 능력 향상을 위해 Thinking with Novel Views(TwNV)라는 새로운 패러다임을 제안했습니다. TwNV는 Reasoner LMM이 공간적 모호성을 파악하고 Painter를 통해 새로운 시점을 합성하도록 지시하며, 추가 증거를 바탕으로 재검토하는 방식으로 작동합니다.

연구 결과, 숫자 기반 카메라 포즈 사양이 언어 기반 지시보다 더 안정적인 시점 제어에 효과적이며, 합성된 시점의 품질이 공간 정확도와 밀접하게 연관되어 있음을 확인했습니다.

네 가지 공간 하위 작업 범주와 네 가지 LMM 아키텍처에서 TwNV를 적용한 결과, 정확도가 +1.3~+3.9pp 향상되었으며, 특히 시점에 민감한 하위 작업에서 큰 효과를 보였습니다.

##LMM##공간지능##생성모델##컴퓨터비전##연구
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기