연구팀은 의료 영상 분할에서 앙상블 불일치를 불확실성 지표로 사용하는 방법의 문제점을 지적했어요. K-fold 교차 검증(CV)을 활용한 앙상블이 '딥 앙상블(DE)'로 잘못 불리는 경우가 많다고 해요.
DE는 데이터 노출 효과와 시드 변동성을 혼합하여 불확실성 해석을 어렵게 하지만, CV 앙상블은 때때로 데이터셋에서 평가자 간 변동성과 더 강하게 상관관계를 보일 수 있다고 해요.
연구팀은 DE가 신뢰성 기반 사용(예: 선택적 의뢰/실패 감지)에 적합하고, CV 앙상블은 모호성 대리 지표로 사용해야 한다고 제안하며, nnU-Net 수정본을 공개했어요.