연구진은 LLM 기반 검색 에이전트가 실제로 탐색하는지, 아니면 웹을 통해 이미 알고 있는 것을 검증하는지 조사했어요. 분석 결과, 에이전트는 외부 증거 대신 모델 내부에 저장된 지식에 의존하는 '내재적 지식 의존성(IKD)' 현상을 보였으며, 44.5%의 질문에 도구 없이도 답변했어요. LiveBrowseComp은 에이전트의 탐색 능력을 평가하기 위해 설계되었으며, 기존 모델 순위가 더 이상 성능을 예측하지 못하는 것으로 나타났어요.