CF-VLA는 비전-언어-액션 정책에서 액션 생성을 위한 조잡-정밀 2단계 방식을 제안하여 효율성과 성능을 향상시켰어요. 액션 생성 시작점을 재구성하여 액션에 대한 정보를 가진 시작점을 구성하는 조잡 단계와 잔여 오류를 수정하는 단일 단계 로컬 정제 단계로 나뉘어요. CALVIN 및 LIBERO 실험 결과, 기존 방식보다 효율성과 성능이 뛰어나고 실제 로봇 성공률도 가장 높았어요.