Pulse · AI 뉴스

비전-언어-액션 모델 파인튜닝 시 예상보다 적은 레이어로 충분

VLA · 2026-06-18

연구진은 비전-언어-액션 모델의 레이어별 표현의 중복성을 발견하고, 레이어 압축 파이프라인을 도입해 모델 깊이를 최대 50%까지 줄였습니다.

학습 없이 Centered Kernel Alignment을 활용해 중복 레이어 특징을 식별하고 제거하며, VLM 백본과 연속 제어 정책 헤드 모두 압축했습니다.

압축된 모델은 파인튜닝 시간 40~50% 단축, 실시간 추론 속도 30% 향상이라는 이중 효과를 보이며, 기존 모델 성능을 능가했습니다.

##VLA##로봇##파인튜닝##모델압축##학습효율성

매일 핵심 AI 소식을 한국어로, 빠르게