TraceLab 프로젝트팀이 Claude Code와 Codex를 활용한 코딩 에이전트 세션 4,300건의 워크로드 데이터셋을 공개했어요. 데이터셋은 35만 단계의 LLM 처리와 43만 건의 도구 호출 정보를 담고 있어요. 분석 결과, 코딩 에이전트는 긴 자율 루프, 긴 컨텍스트, 다양한 도구 호출 패턴을 보이며, KV 캐시 관리 개선의 필요성이 확인됐어요.
공개된 데이터셋은 GitHub 저장소에서 다운로드할 수 있으며, 프로젝트 웹사이트에서 추가 정보 확인 가능해요. 이번 데이터셋은 LLM 서빙 최적화에 기여할 것으로 기대돼요.
TraceLab팀은 데이터 수집 파이프라인과 분석 코드도 함께 공개하여 연구자들의 활용도를 높일 예정이에요.