Skill0.5는 에이전트 강화 학습 프레임워크로, 일반적인 기술 내면화와 특정 작업 기술 활용을 결합하여 복잡한 작업을 해결합니다. 일반 기술은 우선적으로 내면화하여 인지적 기반을 구축하고, 쉬운 작업은 진단 프로빙을 통해 단축 경로를 방지하고 특정 기술 활용을 강제합니다. Skill0.5는 ALFWorld와 WebShop에서 기존 방법보다 뛰어난 성능을 보이며, 분산 환경에서도 성능 향상을 이끌어냈습니다.