연구진은 대규모 문서 컬렉션에 대한 분석적 질문 답변이라는 새로운 과제를 제시하고, 이를 위한 벤치마크 MuDABench를 발표했어요. MuDABench는 기존 벤치마크와 달리 수많은 문서에서 정보를 추출하고 종합하여 정량적 분석을 수행해야 하는 난이도가 높아요. 현재 시스템은 정보 추출 정확도와 도메인 지식 부족으로 인해 인간 전문가 수준에 미치지 못하며, MuDABench는 GitHub에서 확인할 수 있어요.