Qwen3.6-27B 모델을 사용할 때 250W 전력이 최적의 성능을 내는 지점이라고 해요. 동시 요청 1건일 때 275W에서 더 높은 토큰 생성 속도를 기록했는데, 흥미로운 결과네요. VLLM 설정을 통해 모델을 실행하고 벤치마크를 수행하여 전력과 성능 간의 균형을 찾았다고 합니다.