새로운 벤치마크 결과, 코딩 에이전트의 TPS(Transactions Per Second)가 TensorRT-LLM 대비 31% 향상됐어요. TTFT(Time To First Token)는 포화 상태에서 2배 더 빠르고, Claude Opus 4.6보다 비용 효율성이 76% 더 높아요.
벤치마크는 실제 환경에서 코딩 에이전트의 성능을 측정하기 위해 설계됐으며, 다양한 작업 부하를 시뮬레이션했어요. 이를 통해 개발자는 모델 선택 및 최적화에 필요한 인사이트를 얻을 수 있어요.
결과적으로, 이 벤치마크는 코딩 에이전트의 성능을 평가하고 개선하는 데 중요한 지표를 제공하며, 더 빠르고 저렴한 AI 솔루션 개발에 기여할 수 있어요.