Pulse · AI 뉴스

BrowseComp: 웹 브라우징 에이전트 벤치마크

OpenAI · 2025-04-10

BrowseComp는 웹 브라우징 에이전트의 성능을 평가하기 위한 새로운 벤치마크입니다.

이 벤치마크는 다양한 웹 페이지에서 복잡한 작업을 수행하는 에이전트의 능력을 측정합니다.

연구자들은 BrowseComp를 활용하여 웹 브라우징 에이전트의 성능을 개선하고 새로운 연구 방향을 모색할 수 있습니다.

##에이전트##벤치마크##웹브라우징
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기