GhostVPN 사용자가 RAM 기반으로 소형 LLM을 실행할 때 스레드 수를 제한하는 것이 중요하다고 지적했어요. 모든 스레드를 사용하면 성능 저하가 발생할 수 있습니다. RAM 사용량과 성능 간의 균형을 맞추는 것이 중요합니다.