IPIBench는 MLLM의 인터랙티브 능동 지능을 평가하는 첫 번째 벤치마크입니다. 지속적인 비디오 스트림 환경에서 능동적 모니터링, 작업 관리, 반응-능동 요청을 다룹니다. 평가 결과, MLLM은 능동적 트리거 불안정 및 반응-능동 행동 조정 미흡이라는 한계점을 드러냈습니다. IPI-Agent 프레임워크는 능동적 트리거 안정화 및 다중 턴 상호 작용 조율에 기여하여 기존 MLLM의 성능을 향상시켰습니다.