본 연구는 의료 영상 워크플로우에서 발견 사항이 임상 분류법에 따라 구성되는 계층적 다중 레이블 의사 결정 환경에서 학습을 통한 지연(L2D)을 연구합니다. 기존 방식은 각 레이블에 대한 독립적인 의사 결정을 내리지만, 이는 분류법적 모순과 같은 비일관성을 초래할 수 있습니다. 연구진은 정확한 계층적 일관성 보장 및 성능 향상을 위한 새로운 방법인 택소노믹 벨리프 프로파게이션(TBP)과 재귀적 정책 최적화(RPO)를 제안합니다.