연구진이 분류 작업에 적합한 동적 데이터셋 가지치기 알고리즘 RCAP을 제안했어요. RCAP은 각 클래스별로 학습 데이터셋에 포함될 샘플 비율을 추정하고, 클래스별로 손실을 집계하여 적응적으로 조정해요.
다양한 데이터셋에서 RCAP은 기존 방법보다 우수한 성능을 보이며, 최대 10% 데이터만으로도 불균형 데이터셋에서 전체 데이터 학습보다 1% 이상 성능 향상을 달성했어요.
RCAP은 평균 8.69배 속도 향상 효과를 제공하며, 코드는 GitHub에서 확인할 수 있어요.