연구진은 자율 코딩 에이전트가 코드 저장소에 풀 리퀘스트를 열고 병합하는 현상을 연구했어요. 기존 방식은 개별 에이전트를 평가하는 데 집중하지만, 저장소 전체의 문제는 간과되고 있어요.
93만 건 이상의 에이전트가 작성한 풀 리퀘스트를 분석한 결과, 저장소 수준의 마찰(integration friction)이 개별 에이전트, 작성자, 크기, 작업 내용 등을 고려해도 약 절반이 남아있었어요.
에이전트가 작성한 코드는 저장소 마찰을 인간보다 약 2배 더 많이 집중시키는 경향을 보였으며, 이는 코드베이스 크기, 연령, 작업 형태 등 다양한 요인을 고려해도 유지됐어요. 따라서 AI 기반 소프트웨어는 개별 에이전트가 아닌 생태계 수준에서 측정하고 관리해야 합니다.