Reddit 사용자가 V100 GPU 환경에서 Qwen3.6 27B 모델을 활용해 초당 1000개 생성하는 최고 성능을 테스트했어요. 128개의 동시 요청 시 80t/s의 생성 속도와 3000t/s의 처리 속도를 보여줬어요. MTP (Multi-Threaded Pipeline) 없이도 빠른 속도가 가능했어요.
단일 사용자 환경에서는 초당 80t/s의 생성 속도와 3000t/s의 처리 속도를 보여줬으며, 이는 기존 방식 대비 상당한 개선을 의미해요. Reddit 사용자는 이 결과를 통해 Qwen3.6 27B 모델의 잠재력을 확인했다고 밝혔어요.