연구자들은 LLM이 더욱 발전함에 따라 어휘 기반 검색만으로도 충분한지 질문하고 있습니다. 이에 대한 답을 찾기 위해 BM25와 gpt-5.5를 결합한 Pi-Serini 검색 에이전트를 개발했습니다. Pi-Serini는 BrowseComp-Plus 벤치마크에서 83.1%의 정확도와 94.7%의 증거 회수율을 달성하며 기존 검색 에이전트를 능가했습니다.
Pi-Serini는 문서 검색, 브라우징, 읽기를 위한 세 가지 도구를 갖추고 있으며, BM25 튜닝은 답변 정확도를 18.0% 향상시키고 증거 회수율을 11.1% 향상시킵니다. 검색 깊이를 늘리면 증거 회수율이 더욱 향상됩니다.
Pi-Serini의 소스 코드는 GitHub에서 확인할 수 있으며, 연구자들은 이를 통해 어휘 기반 검색의 가능성을 탐구할 수 있습니다.