연구진은 LLM의 파라미터 업데이트 시 발생하는 재앙적 망각 문제를 해결하기 위해 'Fast-Slow Training (FST)' 프레임워크를 제안했습니다. FST는 빠른 컨텍스트 최적화와 느린 파라미터 업데이트를 결합하여 샘플 효율성을 최대 3배 향상시키고 성능 향상 속도를 높입니다. FST 모델은 기존 RL 방식보다 망각 현상이 적고, 새로운 작업에 대한 적응력이 뛰어나 지속적인 학습 환경에 적합합니다.