Gigabyte X399 Designare EX 보드에서 숨겨진 PCIe 2.0 x4 슬롯 때문에 4배 RTX 3090 LLM 리그 성능이 저조했어요. Linux에서 GPU가 Gen2 x1/Gen1 x4로 협상되는 것을 확인했어요.
nvidia-smi 명령어를 통해 PCIe 슬롯 레이아웃을 확인하고, GPU 위치를 재배치했어요. PCIe 2.0 x4 슬롯은 NIC에 속해 있었던 것이었어요.
수정 후 Qwen3.6 27B BF16 vLLM TP=4 + MTP에서 78~80 tok/s의 성능을 기록했어요. llama.cpp에서 --split-mode tensor 옵션을 사용해 Mistral 128B GGUF 성능도 24.7 tok/s로 향상됐어요.