Pulse · AI 뉴스

SpatialClaw: 유연한 공간 추론을 위한 새로운 에이전트 인터페이스

SpatialClaw · 2026-06-11

SpatialClaw는 공간 추론 능력이 필요한 시각-언어 모델(VLM) 에이전트의 성능을 제한하는 기존 인터페이스의 한계를 극복하기 위해 개발됐어요.

SpatialClaw는 코드를 액션 인터페이스로 활용해 VLM 에이전트가 이전 결과물을 기반으로 유연하게 분석 전략을 조정하고 복잡한 3D/4D 공간 추론을 수행할 수 있도록 지원해요.

20개의 공간 추론 벤치마크에서 SpatialClaw는 평균 정확도 59.9%를 기록하며 기존 방식보다 11.2% 높은 성능을 보였고, 다양한 VLM 백본에서도 일관된 성능 향상을 보여줬어요.

SpatialClaw는 별도의 튜닝 없이도 다양한 VLM 백본에서 뛰어난 성능을 발휘하며, 공간 추론 에이전트의 새로운 가능성을 제시해요.

SpatialClaw는 기존 방식의 단일 패스 코드 실행이나 제한적인 구조화된 인터페이스를 벗어나, VLM 에이전트가 자유롭게 연산 결과를 조합하고 분석을 조정할 수 있도록 설계됐어요.

##공간추론##에이전트##SpatialClaw##VLM
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기