연구진은 LLM의 파라미터 업데이트 방식의 단점을 극복하기 위해 빠른(context) 학습과 느린(parameter) 학습을 결합한 프레임워크를 제안했어요. Fast-Slow Training (FST)은 기존 RL 방식보다 최대 3배 더 효율적이며, 성능 향상 속도도 더 빠르다고 합니다. FST는 파라미터 업데이트 시 발생하는 재앙적 망각을 줄이고, 새로운 작업에 대한 적응력을 높여 지속적인 학습 환경에 적합합니다.