연구진이 실시간 스포츠 중계, 자율 주행 등 다중 스트림 상호작용을 요구하는 응용 분야를 위해 멀티 스트림 스트리밍 이해 벤치마크 X-Stream을 공개했어요.
X-Stream은 4,220개의 QA 페어를 포함하며, 단일 스트림 벤치마크의 한계를 극복하기 위해 이중 검증 파이프라인으로 구축돼 여러 시나리오에서 모델 성능을 평가해요.
실험 결과, 최신 MLLM은 동시 스트림 처리에서 어려움을 겪으며, 50% 정도의 낮은 점수를 기록하고 선제적 능력 부족을 드러냈어요.