NVIDIA Run:ai는 AI 워크로드 확장에 따른 처리량, 효율적인 자원 활용, 예측 가능한 지연 시간 문제를 해결하기 위해 개발되었습니다. GPU 분할 기술을 통해 여러 AI 모델을 단일 GPU에 배치하여 자원 활용률을 높이고, 각 모델의 성능을 독립적으로 관리할 수 있습니다. Run:ai는 클라우드 환경에서 AI 모델을 운영하는 데 필요한 관리 및 최적화 기능을 제공하여 개발 생산성을 향상시킵니다.