Pulse · AI 뉴스

GR3D: 3D 공간 인지 능력 향상 시킨 시각-언어 모델

GR3D · 2026-05-29

연구진이 2D/3D 공간 인지 능력을 강화한 시각-언어 모델 GR3D를 공개했어요. GR3D는 텍스트 생성 중 시각적 증거를 참조할 수 있도록 실시간으로 토큰을 삽입하는 기능이 특징이에요.

2D 인지 능력과 함께 3D 바운딩 박스 예측 기능을 지원하며, 공간 이해 문제를 2D 인식과 3D 추론으로 분해해 해결해요.

GR3D는 기존 벤치마크에서 성능 향상을 보이며, 공간 이해 능력을 강화하는 데 효과적인 기술임을 입증했어요.

##VLM##공간인지##3D모델링##GR3D
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기