Pulse · AI 뉴스

Imaginative Perception Tokens, 다중 모드 언어 모델의 공간 추론 능력 향상

BAGEL · 2026-06-03

연구진은 시야에 없는 공간 정보를 추론하는 'Imaginative Perception Tokens (IPT)'를 제안했어요.

IPT는 시점 변화에 따른 가상 시각적 정보를 외부적으로 표현하여 공간 추론 능력을 향상시키는 기술이에요.

Perspective Taking, Path Tracing, Multiview Counting 3가지 task에서 IPT가 기존 방식보다 성능을 개선했으며, 언어 기반 추론 방식보다 효과적이었어요.

##공간추론##다중모드##언어모델##ImaginativePercepti##VLMs
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기