연구진은 의사 결정 트리의 한계를 극복하기 위해 3분할 의사 결정 트리를 제안했어요. 이 모델은 분할 기준점 주변에 불확실성 영역을 설정하여 경계선에서 멀리 떨어진 데이터와 정확히 경계선 위에 있는 데이터에 동일한 신뢰도를 부여하는 문제를 해결해요.
불확실성 영역 내의 데이터는 두 개의 하위 트리를 가중 평균하여 예측하며, 이는 다운스트림 애플리케이션에서 다르게 처리될 수 있어요. 불확실성 영역의 크기(delta)는 표준 CART 분할 기준을 기반으로 계산되며, 별도의 노이즈 사양이 필요하지 않아요.
72개의 OpenML-CC18 데이터셋에서 5-겹 교차 검증을 통해 5가지 delta 추정 방법이 모두 표준 CART보다 우수한 성능을 보였으며, 마진 방법은 가장 높은 효율성을 달성하고 72개 데이터셋 중 42개에서 승리했어요. 의료 및 금융 데이터셋 실험 결과, 노드 부트스트랩 방법은 유방암 검진에서 10.8%의 사례를 불확실성으로 플래그하여 0.71%의 결정 정확도를 향상시켰어요.