ollama 팀이 llama-server 관련 여러 버그 수정 및 개선 사항을 담은 v0.30.0-rc32 버전을 공개했어요. Windows 환경에서 멀티 GPU 지원을 위한 ROCm 빌드 플래그가 추가됐고, 임베딩 API의 일관성 문제도 해결됐어요. 이미지 생성 기능은 v4/v3 모델 선택 로직을 통일하여 오류를 수정했어요.
v0.30.0-rc32는 메모리 제약 환경에서 배치 크기를 줄이고, mlx에서 v3 모델 로딩 오류를 수정하는 등 다양한 개선 사항을 포함하고 있습니다. 또한, 임베딩 모델 재로드 버그 수정과 iGPU 활성화 방법 안내도 포함돼 있어요.
이번 업데이트는 자동 llama.cpp 업데이트 테스트 환경 설정과 버전 번호 업데이트도 포함하고 있습니다.