연구진이 복잡한 구조나 손상된 손실 함수 없이 단안 3D 재구축을 가능하게 하는 PointDiT라는 새로운 모델을 공개했어요. PointDiT는 원시 3D 포인트 맵 패치로 직접 작동하며 사전 학습된 DINOv3 이미지 토큰으로 조건부 학습돼요. 기존의 잠재 확산 방식과 달리, 본 모델은 확산 백본을 처음부터 학습해 포인트 맵 토크나이저가 필요 없어요.
PointDiT는 단순함에도 불구하고 복잡한 잠재 기반 확산 모델보다 성능이 뛰어나고 하이브리드 대안보다 훨씬 간단해요. 특히 투명한 물체와 같이 모호한 영역에서 더 선명한 기하 구조를 생성하고 더 강력한 성능을 보여줘요.
연구 결과는 복잡한 아키텍처나 정교한 손실 함수 없이도 고품질 3D 재구축이 가능하다는 점을 시사하며, 단안 기하 예측 분야에 새로운 가능성을 제시해요.