연구진이 LLM 기반 데이터 에이전트 성능 평가를 위한 종합 벤치마크 AgenticDataBench를 발표했어요. 15개 분야의 실제 데이터셋과 LLM 기반 작업 생성 방식으로 현실적인 작업 환경을 반영했어요. AgenticDataBench는 데이터 과학 기술 스킬을 활용해 작업의 다양성을 확보하고, 상세한 성능 분석을 지원해요.