연구진은 제한된 시야로 긴 영상을 처리하는 MLLM의 한계를 극복하기 위해 MACF(Multi-Agent Collaboration Framework)를 제안했습니다. MACF는 영상을 세그먼트로 나누고 각 에이전트의 시야 예산을 분리하여 전체 비디오 복잡도에 맞게 조정합니다. 실험 결과, MACF는 동일한 예산 제약 하에서 기존 MLLM 및 멀티 에이전트 시스템보다 뛰어난 성능을 보였습니다.