연구진은 기존 오블리크 결정 트리 학습의 한계를 극복하기 위해 DTSemNet이라는 새로운 방법을 제안했어요. DTSemNet은 기존 방식의 근사 오류 없이 기울기 기반 학습을 가능하게 합니다.
DTSemNet은 신경망으로 하드 오블리크 결정 트리를 표현하며, 분류 문제뿐 아니라 회귀 문제에서도 정확한 기울기 신호를 제공하는 annealed Top-k 방법을 도입했어요.
실험 결과, DTSemNet으로 학습한 오블리크 결정 트리는 기존 방식보다 성능이 뛰어나며, 강화 학습 환경에서 정책으로 활용될 수 있음을 보여줬습니다.