사용자가 LLM 멀티홉 추론 성능을 개선하기 위해 오픈소스 지식 그래프 파이프라인을 구축했어요.
spaCy로 개체명 추출, NetworkX로 가중치 공동 발생 그래프 구축, greedy_modularity_communities로 주제별 커뮤니티 감지 과정을 거쳐요.
Dense Vector + BM25 하이브리드 검색, 그래프 탐색, 상호 순위 융합(RRF), Cross-Encoder 재점수를 활용해요.
GitHub에서 파이프라인 코드를 공개했으며 피드백을 환영해요.