Pulse · AI 뉴스

llama.cpp 메모리 부족(OOM) 문제 발생

Qwen · 2026-05-25

사용자가 llama.cpp 서버 실행 중 메모리 부족(OOM) 문제를 겪고 있어요. 약 20~40분 사용 후 시스템 RAM을 과도하게 사용하며 프로세스가 종료돼요. cgroup을 통해 메모리 제한을 설정해 임시적으로 해결했지만, 근본적인 문제는 해결되지 않았어요.

다양한 설정 변경 (no-mmap, cache-ram 0 등)을 시도했지만, 메모리 누수 현상은 반복돼요. Qwen3.6-27B-MTP-GGUF 모델을 사용하며, mtp 옵션 제거 시도도 해봤어요.

다른 서버에서는 llama-swap을 통해 llama.cpp 서버를 실행하는데, 이 서버에서는 문제가 발생하지 않지만 실행 시간이 짧은 편이에요.

##llama.cpp##메모리누수##Qwen3.6

매일 핵심 AI 소식을 한국어로, 빠르게