연구진이 ARC Raiders의 베스트아리에서 영감을 받은 로봇 형태를 특징으로 하는 새로운 강화 학습 환경 ARC-RL을 공개했어요.
ARC-RL은 퀸, 배스천, 틱, 리퍼 4가지 로봇 형태를 포함하며, 이들은 통일된 관측 템플릿과 보상 함수를 공유해요.
연구에서는 SAC, SPEQ, SOPE-EO 등 표준 온라인 알고리즘과 사전 데이터를 활용한 방법의 성능을 비교 분석하여 형태 다양성과 애니메이션 스타일 제약 조건에 대한 적응력을 평가했어요.