연구진이 인간 학습 과정을 모방한 '수면(Sleep)' 패러다임을 LLM에 도입해 지속적인 학습과 지식 통합을 가능하게 했어요. 수면 단계는 '기억 통합'과 '꿈'으로 구성되며, 기억 통합은 작은 모델의 기억을 큰 모델에 녹여 지식 용량을 늘리는 과정이에요. 꿈 단계는 강화 학습을 활용해 모델 스스로 학습 커리큘럼을 생성하고, 새로운 지식을 반복하며 기존 능력을 개선하는 과정으로, 다양한 실험에서 효과를 입증했어요.