Pulse · AI 뉴스

LiveBrowseComp: 검색 에이전트, 정말 탐색하는가, 아니면 이미 알고 있는 것을 검증하는가?

LiveBrowseComp · 2026-05-28

연구진은 LLM 기반 검색 에이전트가 실제로 탐색하는지, 아니면 웹을 통해 이미 알고 있는 것을 검증하는지 조사했어요.

분석 결과, 에이전트는 외부 증거 대신 모델 내부에 저장된 지식에 의존하는 '내재적 지식 의존성(IKD)' 현상을 보였으며, 44.5%의 질문에 도구 없이도 답변했어요.

LiveBrowseComp은 에이전트의 탐색 능력을 평가하기 위해 설계되었으며, 기존 모델 순위가 더 이상 성능을 예측하지 못하는 것으로 나타났어요.

##LLM##검색에이전트##LiveBrowseComp
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기