Pulse · AI 뉴스

자작 오픈 소스 에이전트, 제미니-3-플래시-프리뷰로 터미널벤치에서 최고 점수 기록

Gemini · 2026-04-27

사용자가 직접 개발한 오픈 소스 에이전트가 제미니-3-플래시-프리뷰를 기반으로 터미널벤치에서 최고 점수를 기록했어요.

자작 에이전트는 65.2%의 점수를 획득하여 구글 공식 모델과 기존 최고 성능의 클로즈드 소스 모델을 능가했어요.

터미널벤치 2.0의 부정행위 가능성을 인지하고, 에이전트 개발 과정에서 부정행위 요소를 사용하지 않았음을 밝혔어요.

##에이전트##오픈소스##벤치마크##Gemini##TerminalBench
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기