사용자가 Qwen3.6-27B 모델을 두 개의 V100 GPU에서 llama.cpp를 사용하여 벤치마크하는 과정에서 문제가 발생했어요. llama-bench 실행 시, 모델이 두 GPU에 분산되지 않고 한 GPU에서 먼저 실행된 후 다른 GPU에서 실행되는 문제가 발생했습니다. 사용자는 이 문제를 해결하기 위한 올바른 옵션에 대한 질문을 Reddit에 올렸습니다.