Prox-E는 텍스트 기반 2D 이미지 편집 모델을 활용한 3D 편집의 한계를 극복하기 위해 개발된 프레임워크예요. 입력된 3D 형태를 기하학적 원시 요소로 추상화하고, 사전 학습된 VLM을 통해 원시 수준의 변경을 지정하여 정밀한 3D 편집을 가능하게 해요. 실험 결과, Prox-E는 기존 방식보다 형태의 일관성, 품질, 지시사항 충실도를 효과적으로 균형을 맞추는 것을 확인했어요.