연구진이 디퓨전 모델의 추론 속도를 높이는 ReCache를 제안했어요. ReCache는 사용자가 설정한 예산 내에서 이미지 생성 품질을 최대화하는 캐싱 스케줄을 학습합니다. REINFORCE를 통해 학습하며, 이미지 생성 과정의 레이블 데이터가 필요하지 않아요. ReCache는 다양한 캐싱 메커니즘과 호환되며, FLUX에서 FLOPs를 5배 줄이면서 LPIPS를 31% 감소시켰어요.
Wan 2.1에서 ReCache는 속도를 약 2.6배 향상시키면서 LPIPS를 65% 줄이고 VBench 점수를 7% 끌어올렸어요. ReCache는 기존 캐싱 스케줄링 방식보다 우수한 성능을 보여줘요. 코드는 GitHub에서 확인할 수 있어요.
ReCache는 사용자가 원하는 컴퓨팅 예산을 직접 제어할 수 있도록 설계되었으며, 이미지 생성 품질을 최적화하는 캐싱 스케줄을 학습합니다. 이를 통해 디퓨전 모델의 추론 비용을 효율적으로 관리할 수 있어요.