연구진은 실시간 스포츠 중계, 자율 주행 등 다중 스트림 상호작용을 요구하는 응용 분야를 위해 멀티 스트림 이해 벤치마크 X-Stream을 공개했어요.
X-Stream은 4,220개의 QA 쌍으로 구성되어 있으며, 단일 스트림 벤치마크의 한계를 극복하기 위해 이중 검증 파이프라인을 통해 제작됐어요.
실험 결과, 최신 MLLM은 동시 스트림 처리에서 어려움을 겪으며 50% 정도의 낮은 점수를 기록했고, 이는 현재 멀티플렉싱 방식의 한계를 보여줘요.