딥 앙상블은 딥러닝 불확실성 측정의 표준 방법으로 널리 알려져 있지만, 그래프 구조 데이터에서는 효과가 제대로 검증되지 않았습니다. 연구 결과, 메시지 전달 그래프 신경망(GNN)에 대한 딥 앙상블은 단일 모델 대비 성능 향상이 미미했습니다. 앙상블의 성능 향상은 주로 최적화 과정의 노이즈를 안정화하는 데 기인하며, 의미 있는 불확실성 추정에는 기여하지 못했습니다.
독립적으로 학습된 네트워크들이 지나치게 유사한 예측을 하는 '에피스테믹 붕괴' 현상이 확인되었습니다. 앙상블은 네트워크 간의 불일치를 통해 에피스테믹 불확실성을 포착하는데, 이 붕괴 현상은 앙상블의 핵심적인 장점을 무력화합니다.