연구진은 로봇 조작을 위한 월드-액션 모델의 시간적 제약 문제를 해결하기 위해 AHA-WAM을 제안했어요. AHA-WAM은 DiT 아키텍처를 기반으로 월드 예측과 액션 실행을 비동기화하여 월드 브랜치의 불필요한 프레임 변동 모델링을 줄였어요. RoboTwin과 실제 로봇 조작 환경에서 실험 결과, 기존 모델보다 성능이 향상되었으며 4.59배 빠른 제어 속도를 달성했어요.