연구진은 장기적인 목표 달성을 위해 제한된 토큰과 지연 시간 내에서 효율적으로 작동하는 SPIKE라는 새로운 프레임워크를 공개했어요. SPIKE는 전략적 판단과 빠른 반응성을 결합하여 게임 플레이 중 발생하는 실패를 회복하고 방향 감각을 유지하도록 돕습니다.
SPIKE는 전략 컨트롤러와 반응 컨트롤러를 이중으로 사용하며, 이벤트 트리거가 시각적 변화, 작업 진행, 반복적인 행동, 실패 신호를 감지하여 언제 전략적 판단을 다시 불러올지 결정합니다.
StarDojo 환경에서 SPIKE는 기존 방식 대비 성공률을 5.0% 향상시키고 토큰 사용량은 54.9%, 지연 시간은 40.8% 감소시키는 성과를 보여주며, 선택적인 추론의 중요성을 입증했습니다.