CRONA는 시각 및 청각 정보를 활용하는 다중 에이전트 강화 학습(MARL) 프레임워크입니다. 이 프레임워크는 각 에이전트가 특정 모달에 특화되어 협업하며, 제어에 중요한 보조 믿음과 중앙 집중식 다중 모달 크리틱을 활용합니다.
실험 결과, CRONA는 단일 에이전트 기반 모델보다 성능과 효율성 측면에서 상당한 개선을 보였습니다. 짧은 거리 내비게이션에서는 제한된 모달로의 균일한 협업이 충분하며, 복잡한 환경에서는 풍부한 다중 모달 인식과 모델 용량이 필요합니다.
CRONA는 실제 환경에서 로봇 내비게이션 성능을 향상시키는 데 기여할 수 있으며, 향후 다양한 크로스 모달 협업 연구에 활용될 수 있을 것으로 기대됩니다.