연구진이 객체 가림새 문제를 해결하기 위해 SA-Z 데이터셋을 구축하고 OcclusionFormer라는 새로운 프레임워크를 개발했어요. 기존 모델은 객체가 겹치는 영역에서 가림새 정보를 명시적으로 다루지 못해 텍스처가 엉키거나 물리적으로 일관되지 않은 레이어가 생성되는 문제가 있었어요.
OcclusionFormer는 Z-순서 우선순위를 명시적으로 모델링하여 인스턴스를 분리하고 볼륨 렌더링을 통해 합성하며, 개별 인스턴스를 감독하는 쿼리 정렬 손실을 도입하여 미세한 공간 정확도를 높여요.
새로운 방법은 겹치는 영역의 모호성을 줄이고 정확한 가림새 의존성을 강제하며 구조적 무결성을 유지하여 다양한 장면에서 정확도를 크게 향상시켰어요.