이 글은 8K 토큰 제한 환경(Ollama, LM Studio, Groq, OpenRouter 등)에서 코딩 에이전트를 구축하면서 얻은 경험을 공유합니다. 프로젝트 전체를 한 번에 처리하는 대신, 프로젝트 맵, 작업 목록, 파일별 실행기로 나누어 토큰 사용량을 효율적으로 관리했습니다.
토큰 예산을 코드 레벨에서 강제하고, 병렬 실행을 통해 작업 속도를 향상시켰습니다. 또한, 질문 형식의 요청으로 인한 파일 덮어쓰기, 오래된 프로젝트 맵, 마크다운 펜스 문제 등 다양한 문제점을 해결했습니다.
50개 이상의 파일로 구성된 대규모 코드베이스에서 이 방법이 잘 작동하는지 확인하고 있으며, GitHub를 통해 구현체를 공개했습니다.