LangFlash는 희소 이미지에서 언어 기반 3D 가우시안 스플래팅 장면을 재구성하는 프레임워크입니다. 기존 최적화 방식과 달리 단일 패스에서 3D 기하학적 구조와 의미를 예측하여 저지연 재구성과 언어 일관성 있는 장면 이해를 지원합니다.
RealEstate10k 데이터셋에 의미론적 정보를 추가하여 대규모 학습을 지원하고, 전역 의미론적 사전과 지역별 가중치를 결합한 희소 의미론적 인코딩 방식을 제안했습니다.
실험 결과, LangFlash는 기존 방식보다 뛰어난 신규 뷰 합성 및 의미론적 일관성을 달성했습니다.