AI 에이전트 전문 달파가 오픈AI의 ‘MLE-벤치’에서 글로벌 최고 수준의 종합 점수 79.11%를 기록했어요. MLE-벤치는 오픈AI가 공개한 AI 에이전트 성능 평가 지표로, 실제 캐글 비즈니스 과제 75개를 자율적으로 해결하는 능력을 측정해요. 달파의 ‘코브라 에이전트’는 데이터 전처리부터 모델 학습, 최적화까지 머신러닝 엔지니어링 전 과정을 스스로 완수하며 높은 점수를 받았습니다.