Pulse · AI 뉴스

단일 이미지에서 3D 장면 재구성: Vision-Language 모델 기반 Staged Executable Inverse Graphics

Blender · 2026-06-01

연구진은 단일 이미지에서 3D 장면을 재구성하는 Staged Executable Inverse Graphics (SEIG) 프레임워크를 개발했어요. 이 프레임워크는 Vision-Language 모델(VLM)을 활용해 Blender 프로그램으로 장면을 재구성하며, 2D/3D 모델이나 렌더링, 다중 뷰 감독 없이 작동해요. SEIG는 기하학, 재질, 구도, 조명 등 장면 요소를 점진적으로 개선하며, 다양한 재구성 지표에서 높은 성능을 보였어요.

SEIG는 장면 재구성의 정확도를 높이기 위해 작업 분해의 중요성을 강조하며, 픽셀, 인식, 의미 충실도를 모두 고려한 평가를 진행했어요. 연구 결과, 단계별 재구성이 재구성 정확도를 크게 향상시키는 것으로 나타났어요.

연구진은 재구성된 편집 가능한 Blender 장면을 활용한 다양한 활용 사례를 선보이며, 단일 이미지에서 3D 장면을 재구성하는 새로운 가능성을 제시했어요.

##3D재구성##VisionLanguageModel##Blender##InverseGraphics##SEIG

매일 핵심 AI 소식을 한국어로, 빠르게

App Store 에서 Pulse 받기 앱에서 열기