연구진은 비전-언어-액션 모델의 레이어별 표현의 중복성을 발견하고, 레이어 압축 파이프라인을 도입해 모델 깊이를 최대 50%까지 줄였습니다. 학습 없이 Centered Kernel Alignment을 활용해 중복 레이어 특징을 식별하고 제거하며, VLM 백본과 연속 제어 정책 헤드 모두 압축했습니다. 압축된 모델은 파인튜닝 시간 40~50% 단축, 실시간 추론 속도 30% 향상이라는 이중 효과를 보이며, 기존 모델 성능을 능가했습니다.