사용자 Responsible_Egg9736가 llama.cpp를 쉽게 사용할 수 있도록 GUI LlamaStation v0.9를 공개했어요. llama-server를 직접 실행하여 Ollama와 같은 중간 계층 없이 최대 성능을 제공합니다.
TurboQuant, MTP, AtomicChat, BeeLlama 등 다양한 백엔드를 지원하며, GPU VRAM 사용량을 실시간으로 모니터링하고 모델별 프로필을 저장합니다.
음성 모드, 헤드리스 모드, 자동 업데이트 기능도 제공하며, MIT 라이선스로 공개되어 있어 기여를 환영합니다.