Pulse · AI 뉴스

GPU 모델 로딩 속도, --no-mmap 옵션으로 단축 가능

llama.cpp · 2026-05-11

GPU 모델 로딩 속도가 느린 경우, --no-mmap 옵션을 사용하면 고속 NVMe 드라이브에서 모델을 로딩할 때 속도를 향상시킬 수 있습니다.

Ubuntu 26.0.4에서 문제가 발생하여 Ubuntu 24.0.4로 변경 후 --no-mmap 옵션을 적용하여 로딩 속도를 개선했습니다.

mmap 옵션의 필요성을 인지하지 못하고 사용했다는 점을 깨달았으며, 고속 NVMe 드라이브에서는 mmap 옵션이 불필요할 수 있습니다.

##GPU##llama.cpp##모델로딩##Ubuntu##mmap
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기