연구팀은 실제 업무 환경의 복잡성을 반영하지 못하는 기존 벤치마크의 한계를 극복하기 위해 DV-World를 새롭게 선보였어요. DV-World는 스프레드시트 조작, 시각 자료 적응, 사용자 의도 파악 등 세 가지 영역을 포함하며, 총 260개의 과제를 제공해요. 실험 결과, 최신 모델의 성능이 50% 미만으로 나타나 실제 업무 환경에서 데이터 시각화 에이전트가 해결해야 할 과제가 많다는 것을 보여줬어요.