연구진은 저렴한 기하학적 구조와 CLIP 프록시가 부족한 환경에서 단일 이미지의 3D 메시지 품질을 안정적으로 평가하는 편향 없는 VLM-as-3D-판사를 개발했어요.
TRELLIS라는 강력한 오픈 소스 생성기를 인간 레이블 없이 가구라는 특정 자산 클래스에 특화할 수 있는지 질문하며, 판사의 선호도를 최적화하는 데 초점을 맞췄어요.
판사를 훈련 루프에 통합하는 과정에서 순위에서는 발생하지 않던 오류 모드를 발견하고, 순환성을 방지하기 위해 훈련 판사와 평가 판사를 분리하고 위치 편향을 수정하는 등 판사를 최적화 수준으로 강화했어요.
이 프로토콜을 독립적인 평가자로 사용하고 공개 모델과 데이터를 활용하여 경량화된 파라미터 효율적 적응을 통해 기반 모델을 능가하기보다는 일치시키는 결과를 얻었어요.