Llama.cpp 서버에서 모델 핫스왑 기능이 개선되어 30초 이내에 모델 교체가 가능해졌어요. OpenWebUI 및 Hermes와 연동하여 간편하게 모델을 변경할 수 있으며, 두 번째 모델인 Gemma가 오류를 일으키기도 했지만 핫스왑 속도는 매우 빨라졌어요. 과거에는 모델 로딩에 상당한 시간이 소요되었지만, 현재는 짧은 시간 안에 모델 교체가 가능해졌어요.