Pulse · AI 뉴스

Windows 11과 Linux에서 llama.cpp를 사용할 때 속도 차이는 있을까: MoE 모델 사용 시 신화일 뿐

llama.cpp · 2026-05-31

Reddit 사용자가 Windows 11과 Linux에서 llama.cpp를 사용할 때 속도 차이가 없음을 실험 결과 확인했어요. MoE 모델의 경우 CPU+GPU 하이브리드 오프로딩 시 운영체제에 따른 성능 차이가 미미해요.

Qwen 3.5 122B, 397B, MiniMax 2.7 모델을 다양한 작업(기사 요약, 번역, Java 테스트)에 대해 Windows와 Linux에서 테스트했고, 성능 지표(PP, TG)에서 큰 차이를 발견하지 못했어요.

WSL은 성능이 떨어지는 것으로 나타났으며, 397B 모델의 경우 PP가 140에서 110으로, TG가 16에서 13.5로 감소했어요. 397B 모델 실행 시 전력 소비량은 550~600W 수준이었어요.

##llama.cpp##MoE##Windows##Linux##성능

매일 핵심 AI 소식을 한국어로, 빠르게