Reddit 사용자가 Windows 11과 Linux에서 llama.cpp를 사용할 때 속도 차이가 없음을 실험 결과 확인했어요. MoE 모델의 경우 CPU+GPU 하이브리드 오프로딩 시 운영체제에 따른 성능 차이가 미미해요.
Qwen 3.5 122B, 397B, MiniMax 2.7 모델을 다양한 작업(기사 요약, 번역, Java 테스트)에 대해 Windows와 Linux에서 테스트했고, 성능 지표(PP, TG)에서 큰 차이를 발견하지 못했어요.
WSL은 성능이 떨어지는 것으로 나타났으며, 397B 모델의 경우 PP가 140에서 110으로, TG가 16에서 13.5로 감소했어요. 397B 모델 실행 시 전력 소비량은 550~600W 수준이었어요.