연구진은 LLM 에이전트의 지속적인 학습을 위한 경험 내면화 방법론을 연구했어요. 기존 방법은 반복적인 경험 학습 시 성능 저하를 겪는다는 것을 발견했어요. 경험의 세부 수준, 주입 방식, 학습 방식 개선을 통해 안정적이고 지속 가능한 경험 내면화 방법을 제시했어요.
원리 수준의 경험이 인스턴스 수준의 경험보다 더 오래 지속되며, 단계별 주입 방식이 전체 주입 방식보다 효과적이라는 것을 밝혀냈어요. 또한, 고품질 교사 데이터 기반의 오프라인 맥락 증류가 학생의 오류 상태에 대한 로컬 수정에 제한되는 온프라인 맥락 증류보다 안정적인 학습 신호를 제공한다는 것을 입증했어요.