본 논문에서는 엣지 환경에서 비전-언어 모델(VLM)의 추론을 위해 점진적 의미 통신 프레임워크를 제안합니다. Meta AutoEncoder를 활용하여 시각적 토큰을 적응형으로 압축하고, 다양한 수준의 정보를 전송하여 통신 비용과 의미 충실도 간의 균형을 맞춥니다. 실험 결과, 1Mbps 업링크 환경에서 기존 방식보다 네트워크 지연 시간을 크게 줄이고 높은 의미 일관성을 유지하는 것을 확인했습니다.