Pulse · AI 뉴스

CrossView Suite: MLLM의 다중 시점 공간 지능 활용

CrossView Suite · 2026-05-19

연구진은 MLLM의 다중 시점 공간 지능을 향상시키기 위해 CrossView Suite를 개발했습니다. CrossView Suite는 데이터셋(CrossViewSet), 벤치마크(CrossViewBench), 그리고 모델 프레임워크(CrossViewer)로 구성되어 있습니다.

CrossViewSet은 17가지 세부 작업 유형을 포함하여 160만 개의 샘플로 구성된 대규모 데이터셋이며, CrossViewBench는 MLLM의 다중 시점 공간 이해 능력을 종합적으로 평가합니다.

CrossViewer는 Perception -> Alignment -> Reasoning의 단계를 거쳐 MLLM의 다중 시점 공간 추론 능력을 향상시키며, 특히 공간 영역 토크나이저를 활용하여 객체 표현을 정교하게 파악하고 다중 시점 객체를 명시적으로 정렬합니다.

##MLLM##공간지능##데이터셋##벤치마크
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기