Reddit 사용자들은 로컬 AI 모델 운영 시 모델 자체는 자급자족하지만, 관련 툴링은 SaaS를 사용하는 경향이 있어요. vLLM, llama.cpp, Open WebUI, Langfuse, ragas 등 자체 호스팅 가능한 툴링 옵션이 이미 잘 갖춰져 있어요. 데이터 유출 우려 없이 전체 파이프라인을 로컬에서 운영할 수 있지만, 대부분의 사용자는 편리함 때문에 SaaS를 선택하는 경우가 많아요.