연구진은 기존 BEV 방식의 한계를 극복하기 위해 3D 가우시안 표현 기반의 새로운 다중 모드 퓨전 프레임워크 GaussianFusion을 제안했어요. 이 방식은 다중 모드 특징을 통합된 3D 가우시안 공간에 자연스럽게 통합하여 디테일 손실을 줄이고 모드 간 정보 교류를 개선해요.
GaussianFusion은 기존 BEVFusion보다 nuScenes 데이터셋에서 2.6 NDS 향상, GaussFormer보다 3D 의미 점유율에서 1.55 mIoU 향상, 그리고 450% 속도 향상을 달성했어요.
GaussianFusion은 특정 작업에 종속되지 않는 범용 모델로, 다양한 3D 인식 작업에 적용 가능한 통합 가우시안 표현을 제공해요.