연구진은 관계 학습 평가 방식이 데이터셋의 구조적 다양성을 간과하여 모델 성능 평가에 편향을 초래한다고 지적했어요. 곡률을 기준으로 데이터셋을 분류하는 새로운 평가 프레임워크를 도입하여 모델 성능의 기하학적 의존성을 밝혀냈어요. GCN, GFM 등 18개 모델을 14개 데이터셋으로 평가한 결과, 모델 순위가 곡률 영역에 따라 크게 달라지는 것으로 나타났어요.