연구진은 생성 모델에서 오류를 가속화할 수 있다는 기존 통념과 달리, 지도 디퓨전 학습에서 엔트로피 기반 가중치를 활용하는 Eisbach 로그 배리어를 제안했어요.
Stable Audio 3 Medium 모델을 MusicCaps 데이터셋으로 LoRA fine-tuning 한 결과, 기존 방식 대비 더욱 뚜렷한 음향 구분, 풍부한 텍스처, 강력한 주제 발전이 관찰됐어요.
이는 모델의 신뢰도에 따라 그래디언트 크기를 조절하여 온라인 데이터 커리큘럼을 형성하며, 평탄한 샘플은 다운, 대비가 높은 샘플은 보존하는 방식으로 작동해요.