스트라이프는 주당 1,300개 이상의 풀 리퀘스트(PR)를 생성하고, 램프는 병합된 PR의 30%를 에이전트에 기여하는 등 코딩 에이전트가 생산 코드 작성 규모를 확장하고 있습니다.
NVIDIA Dynamo는 에이전트 추론을 위한 풀스택 최적화를 제공하여, 모델 추론 속도를 향상시키고 대기 시간을 줄이며 전체 시스템 효율성을 높입니다.
Dynamo는 모델 로딩, 추론 실행, 결과 처리 등 다양한 단계에서 최적화를 지원하며, 특히 대규모 에이전트 시스템에 적합합니다.