연구진이 SkillsVote라는 에이전트 기술 생명 주기 관리 프레임워크를 발표했어요. SkillsVote는 환경 요구 사항, 품질, 검증 가능성을 프로파일링하여 검증 가능한 기술을 합성해요. SkillsVote는 GPT-5.2를 Terminal-Bench 2.0에서 최대 7.9pp 향상시키고 SWE-Bench Pro를 최대 2.6pp 향상시켰어요.
SkillsVote는 실행 후 트레이커리를 기술과 연결된 하위 작업으로 분해하고, 기술 사용, 에이전트 탐색, 환경, 결과 신호에 결과를 속정해요. 성공적인 재사용 가능한 발견만 증거 기반 업데이트를 통해 허용돼요.
SkillsVote는 시스템이 노출, 신용, 보존을 제어할 때 모델 업데이트 없이도 동결된 에이전트를 개선할 수 있는 외부 기술 라이브러리를 가능하게 해요.