Pulse · AI 뉴스

2x3090에서 전력 제한 vs. 토큰 생성 속도

Qwen · 2026-04-28

Qwen3.6-27B 모델을 사용할 때 250W 전력이 최적의 성능을 내는 지점이라고 해요.

동시 요청 1건일 때 275W에서 더 높은 토큰 생성 속도를 기록했는데, 흥미로운 결과네요.

VLLM 설정을 통해 모델을 실행하고 벤치마크를 수행하여 전력과 성능 간의 균형을 찾았다고 합니다.

##모델성능##Qwen3.6##VLLM##벤치마크

매일 핵심 AI 소식을 한국어로, 빠르게