ollama가 v0.30.11 버전으로 업데이트되었어요. MLX 환경에서 모델 최대 컨텍스트 크기 대신 스케줄러가 선택한 컨텍스트 크기를 표시하도록 변경됐어요. 이는 VRAM 용량이 작은 시스템에서 성능 저하를 방지하기 위한 조치예요.
변경된 사항은 클라이언트에게 컨텍스트 크기 제한에 대한 힌트를 제공하여 페이징 및 성능 문제를 줄이는 데 도움이 될 거예요. 이번 업데이트는 ollama 사용자들이 모델 성능을 최적화하는 데 기여할 것으로 보입니다.