Pulse · AI 뉴스

AgenticDataBench: 데이터 에이전트 종합 벤치마크 공개

AgenticDataBench · 2026-07-02

연구진이 LLM 기반 데이터 에이전트 성능 평가를 위한 종합 벤치마크 AgenticDataBench를 발표했어요.

15개 분야의 실제 데이터셋과 LLM 기반 작업 생성 방식으로 현실적인 작업 환경을 반영했어요.

AgenticDataBench는 데이터 과학 기술 스킬을 활용해 작업의 다양성을 확보하고, 상세한 성능 분석을 지원해요.

##데이터에이전트##LLM##벤치마크##AgenticDataBench
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기