연구진은 로봇 공학 및 AR/VR을 위한 핵심 기능인 오픈 보카불러리 3D 인스턴스 분할을 위한 SpaCeFormer라는 새로운 모델을 발표했어요.
SpaCeFormer는 기존 방식보다 2~3배 빠른 속도로 작동하며, 300만 개의 멀티뷰 일관성 캡션이 포함된 SpaCeFormer-3M 데이터셋을 활용했어요.
ScanNet200에서 기존 제안 불필요 방식보다 2.8배 향상된 11.1 mAP를 달성하며 3D 인스턴스 분할 성능을 크게 향상시켰어요.