연구에서는 격투 게임에서 액션을 취할 시간 간격을 스스로 학습하는 새로운 RL 프레임워크를 제안했어요. 액션과 지속 시간을 함께 예측하여 게임 상황에 따라 반응성을 동적으로 조절할 수 있도록 설계되었어요. FightLadder 환경에서 실험 결과, 학습된 타이밍은 잘 선택된 고정 프레임 스킵과 비슷한 성능을 보였지만, 일관된 높은 프레임 스킵 값이 가장 효과적이었어요.