연구진은 LLM 에이전트의 지속적 학습을 위한 Skill-enhanced Test-Time Co-Evolution (LifeSkill) 프레임워크를 제안했어요. 기존 방식의 한계를 극복하기 위해 Verifier-Guided Skill Learning과 Online Skill Internalization을 도입했어요.
Verifier-Guided Skill Learning은 모델이 텍스트로만 판단하는 것이 아니라 실제 문제 해결에 유용한 기술을 생성하도록 보상 체계를 설계했어요.
LifelongAgentBench 실험 결과, LifeSkill은 기존 방식 대비 평균 성능을 7% 향상시켰어요.