연구진은 사용자가 클릭하는 위치를 기반으로 3D 객체를 분할하는 새로운 프레임워크를 제안했는데, 이는 기존의 지도 학습 방식이 비용이 많이 들거나 새로운 클래스에 대한 일반화가 필요할 때 유용합니다.
새로운 프레임워크는 희소한 3D 포인트 데이터를 직접 처리하며, 한 번의 연산으로 여러 객체의 클릭 정보를 동시에 처리하여 기존 방식의 순차적인 예측 방식의 한계를 극복합니다.
실험 결과, 제안하는 모델은 기존 모델보다 mIoU 지표를 20% 이상 향상시켰으며, 단일 클릭으로 객체 분할하는 설정에서 8~10%의 성능 향상을 보였습니다.