연구진은 LLM 개발 파이프라인의 복잡한 의존성 구조를 파악하기 위해 ModSleuth라는 시스템을 개발했어요. ModSleuth는 공개된 자료를 기반으로 LLM 의존성 그래프를 재구성하며, 직접 및 간접 의존성을 구분하고 다양한 파이프라인 역할을 정의해요. 4개의 공개 LLM 출시를 분석한 결과, 1,060개의 소스 기반 의존성을 확인하고 라이선스 의무, 학습-평가 결합, 문서 불일치 등 다양한 문제점을 발견했어요.