연구진은 3D 가우시안 스플래팅(3DGS) 렌더링 속도 향상을 위해 TensorGS 프레임워크를 개발했어요. 기존 3DGS 렌더링은 CUDA 코어에 의존하여 텐서 코어 활용도가 낮았어요. TensorGS는 렌더링 연산을 텐서 코어에 최적화하고, 타일 간 가우시안 재사용을 개선하여 데이터 이동 오버헤드를 줄였어요.
FP16 정밀도로 3DGS 렌더링 시 이미지 품질 저하 없이 텐서 코어 가속이 가능함을 확인했어요. TensorGS는 기존 방식 대비 1.65배 빠른 렌더링 성능을 보여줬어요. 3DGS의 주요 병목 구간인 래스터화 단계를 텐서 코어에 맞게 변환하는 방식으로 성능을 끌어올렸어요.
TensorGS는 3DGS 렌더링 성능을 향상시켜 실시간 렌더링 및 3D 장면 재구성에 기여할 것으로 기대돼요.