연구진은 디퓨전 기반 데이터 증류의 비효율성을 개선하기 위해 'Pool-Select-Refine' 프레임워크를 제안했어요.
이 프레임워크는 먼저 과도한 후보 샘플 풀을 생성하고, 예산 내에서 샘플을 선택한 뒤, 교사 모델의 소프트 라벨을 활용해 잠재 공간에서 샘플을 정제하는 방식이에요.
실험 결과, Pool-Select-Refine은 기존 디퓨전 기반 방법보다 성능 향상을 보였으며, 데이터 증류 예산 활용 효율성을 높이는 데 효과적임을 입증했어요.