Pulse · AI 뉴스

고정된 토큰화 환경에서 BM25 코드 검색 성능 개선: 적응형 q-로그 오즈

BM25 · 2026-05-19

연구진은 검색 시스템 분석기를 제어할 수 없는 고정된 토큰화 환경에서 BM25의 성능 문제를 해결하기 위해 q-로그 오즈를 활용하는 방법을 제시했어요.

CoIR CodeSearchNet Go 데이터셋에서 NDCG@10이 0.2575에서 0.4874로 89.3% 향상되는 효과를 보였으며, 이는 함수 식별자 구분을 개선한 결과예요.

단일 파라미터로 이루어진 폐쇄형 수식을 통해 코퍼스 수준의 q 값을 추정할 수 있으며, 이는 BM25가 이미 최적화된 코퍼스에서는 q=1에 가까운 값을 유지해요.

##BM25##코드검색##정보검색##q-로그
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기