연구진은 그림자 감지를 시각 정보에만 의존하는 기존 방식의 한계를 지적하며, 언어를 활용한 새로운 프레임워크 SVL을 제안했습니다. SVL은 언어적 의미를 활용하여 시각적으로 유사한 어두운 영역을 그림자에서 구별하고, 장면 전체의 그림자 비율을 예측하는 방식으로 작동합니다. DINOv3 이미지 인코더를 기반으로 경량화된 설계로, 시각적으로 모호한 조건에서 강력한 성능과 안정성을 보였습니다.