연구진은 누락된 인용으로 인해 단편화되는 과학적 구조 문제를 해결하기 위해 LLM 기반 텍스트 유사성을 활용한 하이브리드 프레임워크를 제안했어요.
수학 및 운영 연구 분야의 662,369건의 Web of Science 논문을 분석하여 기존 그래프를 보강하고, 텍스트 유사성에 따라 기존 인용의 가중치를 조정했어요.
의미론적 보강은 단편화를 줄이고 학문적 동질성을 유지하며, Leiden 알고리즘을 사용한 클러스터 감지는 구조적 해석력을 제공하며 다중 스케일 조직을 가능하게 해요.