Metaverse 플랫폼에서 아바타를 구성하는 3D 에셋 검색 시 자연어의 모호함과 스타일 불일치 문제를 해결하기 위해 CMAG 프레임워크를 제안합니다. CMAG은 텍스트 프롬프트를 기반으로 3D 컨셉 스캐폴드를 생성하여 의도를 명확히 하고, 시각적 증거를 추출하여 카테고리 일관성을 유지합니다. 실험 결과, CMAG은 기존 방식 대비 더 강력한 검색 정확도와 조립 정확도를 보여주며 3D 컨셉 스캐폴딩의 중요성을 입증했습니다.