연구진은 3D 방 합성을 위한 새로운 프레임워크 'Code-as-Room'을 제안했어요. 이 프레임워크는 MLLM 기반 에이전트 방식으로, Blender 코드를 활용해 3D 방을 표현해요.
탑다운 이미지에서 장면 요소를 추출하고 공간 관계를 파악하여, 기하학, 재질, 조명에 대한 실행 가능한 Blender 코드를 단계별로 합성해요.
연구진은 코드 기반 3D 방 합성을 위한 새로운 벤치마크를 도입하고, 기존 에이전트 기반 방법과 비교하여 Code-as-Room의 효과를 검증했어요.