연구진은 검색 시스템 분석기를 제어할 수 없는 고정된 토큰화 환경에서 BM25의 성능 문제를 해결하기 위해 q-로그 오즈를 활용하는 방법을 제시했어요.
CoIR CodeSearchNet Go 데이터셋에서 NDCG@10이 0.2575에서 0.4874로 89.3% 향상되는 효과를 보였으며, 이는 함수 식별자 구분을 개선한 결과예요.
단일 파라미터로 이루어진 폐쇄형 수식을 통해 코퍼스 수준의 q 값을 추정할 수 있으며, 이는 BM25가 이미 최적화된 코퍼스에서는 q=1에 가까운 값을 유지해요.