사용자가 8x 32GB V100 서버를 구축하고 Llama.cpp로 Qwen 3.5 397B 모델을 256K 컨텍스트로 실행 중입니다. 5090 및 A6000 Pro 머신과 성능 비교를 시도하고 있으며, A6000 Pro는 5090보다 성능이 좋지만 만족스럽지 않습니다. Qwen 3.6 27B 모델이 코딩 에이전트 작업에서 가장 인상적이었지만, 서버 자원을 최대한 활용하지 못하는 것 같아 고민 중입니다.