사용자가 Qwen3.6 모델 실행 시 속도 저하를 겪고 있습니다. 병렬 처리 설정을 1로 하고 다양한 옵션을 조절했지만 속도가 오히려 느려졌습니다. RTX 5090 GPU를 사용하고 Docker 환경에서 모델을 실행 중입니다. 현재 토큰 처리 속도는 100토큰/초인데, 옵션 변경 시 80토큰/초로 감소했습니다. 사용자는 모델 설정에 대한 조언을 구하고 있습니다.