SkillCAT은 LLM 에이전트의 기술 자체 진화를 위한 새로운 프레임워크로, 기존 방식의 한계를 극복하기 위해 개발됐어요.
CCE를 통해 다양한 실행 경로를 비교 분석하고, AAE를 통해 성능 개선 또는 유지하는 기술 패치를만 선별하며, TTE를 통해 관련 기술 노드만 로드하여 추론 속도를 높여요.
SpreadsheetBench, WikiTableQuestions, DocVQA 벤치마크에서 기존 방식 대비 최대 40.40% 성능 향상을 보여 신뢰성 있는 기술 진화 가능성을 입증했어요.