연구진은 LLM이 생성한 노드 기능을 GNN에 추가하면 정확도가 향상되는 것이 일반적이지만, 단순히 입력 연결만으로는 오히려 성능을 저하시킬 수 있음을 확인했어요.
GPT-4o-mini TAPE 기능을 연결했을 때 PubMed 테스트 정확도가 -17.0%p 감소하고 Cora는 -4.3%p 감소하는 현상이 관찰됐어요.
LLM 기능 연결은 동종성이 낮은 데이터셋에서는 성능을 향상시키지만, 동종성이 높은 데이터셋에서는 오히려 성능 저하를 일으키며, LLM의 자체적인 차별력(Delta_sig)과 연결 비용 간의 상관관계가 발견됐어요.