llama-swap이 모델 그룹핑 기능을 새롭게 선보이며, 모델이 단일 그룹에만 존재하던 기존 방식에서 벗어나 사용자가 원하는 그룹을 자유롭게 구성할 수 있게 됐어요. 새로운 기능은 모델 요청 시, '비용'을 고려하여 필요한 모델만 실행하고 나머지는 언로드하여 효율성을 높여요. 사용자는 큰 모델 전용 그룹, STT와 큰 모델 조합 그룹, RAG 활용 그룹 등 다양한 그룹을 설정하여 모델을 관리할 수 있어요.