Pulse · AI 뉴스

달파, 오픈AI ‘MLE-벤치’서 글로벌 최고 성능 입증

달파 · 2026-05-07

AI 에이전트 전문 달파가 오픈AI의 ‘MLE-벤치’에서 글로벌 최고 수준의 종합 점수 79.11%를 기록했어요.

MLE-벤치는 오픈AI가 공개한 AI 에이전트 성능 평가 지표로, 실제 캐글 비즈니스 과제 75개를 자율적으로 해결하는 능력을 측정해요.

달파의 ‘코브라 에이전트’는 데이터 전처리부터 모델 학습, 최적화까지 머신러닝 엔지니어링 전 과정을 스스로 완수하며 높은 점수를 받았습니다.

##AI에이전트##MLE벤치##달파

매일 핵심 AI 소식을 한국어로, 빠르게