연구진은 텍스트 기반 방법의 한계와 기존 이미지 기반 에이전트의 불안정성을 해결하기 위해 Code-as-Room 프레임워크를 제안했어요. 이 프레임워크는 Blender 코드로 3D 방을 표현하며, 탑다운 이미지에서 장면 요소를 추출해 3D 방을 생성해요.
Code-as-Room은 구조화된 실행 하니스를 갖추고 있으며, 각 단계별로 기억을 유지하는 모듈을 통해 기존 에이전트 기반 프레임워크의 맥락 망각 문제를 완화해요.
연구진은 코드 기반 3D 방 합성을 위한 새로운 벤치마크를 도입하고, 기존 에이전트 기반 방법과 비교하여 제안하는 실행 하니스의 효과를 검증했어요.