MinT는 LoRA(Low-Rank Adaptation) 후속 훈련 및 온라인 서비스 관리를 위한 시스템으로, 여러 정책을 소수의 고가치 기반 모델 배포 환경을 목표로 합니다.
MinT는 1T 이상의 총 파라미터를 지원하며, LoRA 어댑터만 이동시켜 핸드오프 단계를 18.3배 단축하고, GPU 사용량을 줄입니다.
MinT는 100만 규모의 LoRA 정책 카탈로그를 관리하며, 공유된 1T급 기반 모델에서 선택된 어댑터 개정을 훈련하고 서비스합니다.