연구진은 복잡한 의료 EHR 데이터를 활용하는 GraphRAG의 신뢰성을 개인 GPU 환경에서 평가했어요. Llama 3.1, Mistral, Qwen 2.5, Phi-4-mini 등 4개 모델을 Ollama를 통해 8GB VRAM GPU에 배포하여 성능을 측정했어요. 결과적으로 Qwen 2.5가 가장 높은 답변 품질(5점 만점 3.3점)을 보였고, 7B 미만 모델은 GraphRAG 파이프라인을 완료하지 못하는 한계가 있었어요.