연구진은 텍스트 기반 실내 공간 생성 및 편집을 위한 계층적 도메인 특화 언어 HDSL을 제안했어요. HDSL은 XML/CSS 스타일로, 방·구역·객체·지지면을 트리 구조로 표현하여 복잡한 장면 계획 및 편집을 용이하게 해요.
HDSL 파이프라인은 LLM 에이전트를 활용해 HDSL 서브트리를 생성하고, 다중 모달 자산 검색을 통해 현실 기반 노드를 생성하며, 충돌 오류를 수정하기 위해 힘 지향 레이아웃 최적화를 적용해요.
편집 시에는 Hierarchical Retrieval-Augmented Generation (HRAG)을 통해 관련 서브트리를 검색하고, LLM이 해당 로컬 컨텍스트만 재작성하도록 유도하며, 결정적 3-way 병합을 통해 결과를 통합해요.
실험 결과, HDSL은 객체 커버리지, 텍스트-장면 정렬, 생성 시간 측면에서 기존 방식보다 성능이 향상되었고, 편집 시에는 토큰 사용량과 실행 시간을 크게 줄이고 유효한 DSL을 생성하며, 관련 없는 객체 보존 능력이 뛰어남이 확인됐어요.