사용자가 llama.cpp 서버 실행 중 메모리 부족(OOM) 문제를 겪고 있어요. 약 20~40분 사용 후 시스템 RAM을 과도하게 사용하며 프로세스가 종료돼요. cgroup을 통해 메모리 제한을 설정해 임시적으로 해결했지만, 근본적인 문제는 해결되지 않았어요.
다양한 설정 변경 (no-mmap, cache-ram 0 등)을 시도했지만, 메모리 누수 현상은 반복돼요. Qwen3.6-27B-MTP-GGUF 모델을 사용하며, mtp 옵션 제거 시도도 해봤어요.
다른 서버에서는 llama-swap을 통해 llama.cpp 서버를 실행하는데, 이 서버에서는 문제가 발생하지 않지만 실행 시간이 짧은 편이에요.