연구진이 물리적 환경에 안전하게 적용 가능한 부드러운 연속 제어를 위해 Dual-Window Smoothing (DWS) 프레임워크를 제안했어요. DWS는 기존 액션 청킹 방식의 단점을 극복하고 시간적 일관성을 유지하면서도 액션 공간을 확장하지 않아요. DeepMind Control Suite와 산업 에너지 관리 작업에서 SOTA 모델보다 뛰어난 성능을 보여줬어요.
DWS는 실행 윈도우와 값 윈도우라는 이중 윈도우 설계를 사용해 물리적 부드러움과 비평가 편향을 동시에 보장해요. 또한, 액터 측에서 경량화된 시간 정규화기를 적용해 전역적 연속성을 촉진해요.
복잡한 시각 기반 자율 주행 작업에서 DWS는 더 부드러운 제어, 더 안전한 행동, 그리고 100% 성공률을 달성했어요.