연구진이 인간 학습 방식에서 영감을 받아 LLM의 지속적인 학습 능력을 향상시키는 '수면(Sleep)' 패러다임을 제안했어요. 수면은 지식 증류(Knowledge Seeding)를 통해 단기 기억을 장기 지식으로 통합하고, '꿈(Dreaming)' 과정을 통해 RL 기반의 합성 데이터 재현을 통해 자기 개선을 반복하는 두 단계로 구성돼요. 지속적인 학습, 지식 통합, 소량 데이터 일반화 실험 결과, 수면 단계의 중요성을 입증했어요.