Cursor가 Together AI와 협력하여 에디터 내 AI 에이전트의 빠른 속도와 안정성을 유지하는 실시간 추론 스택을 구축했어요.
NVIDIA Blackwell (B200/GB200)을 활용하여 ARM 호스트, 커널, FP4/TensorRT 양자화를 튜닝하여 지연 시간을 줄이고 모델 배포 속도를 높였어요.
이번 협력을 통해 Together AI는 실시간 추론 인프라 구축 경험을 얻고, Cursor는 AI 에이전트 성능을 향상시킬 수 있게 되었어요.