연구진이 장면 복원 효율성을 높이는 새로운 3D 가우시안 스플래팅 모델 'ZipSplat'을 제안했어요. ZipSplat은 카메라 해상도에 묶이지 않고 장면 복잡도에 따라 가우시안 수를 조절하는 토큰 기반 방식입니다.
k-means 클러스터링을 활용해 장면 토큰을 압축하고, 크로스/셀프 어텐션을 통해 가우시안을 정교화하며, 가벼운 MLP로 3D 위치를 디코딩합니다.
ZipSplat은 DL3DV 및 RealEstate10K 데이터셋에서 기존 방식보다 6배 적은 가우시안으로 최고 성능을 달성했으며, Mip-NeRF360 및 ScanNet++ 데이터셋에서도 뛰어난 성능을 보였어요.