Pulse · AI 뉴스

Qwen3.6-27B 모델 100K 컨텍스트 활용 정보 공유

Qwen · 2026-05-07

사용자가 3090 GPU 환경에서 Qwen3.6-27B 모델을 llama.cpp로 실행하며 50 t/s 속도를 기록했습니다.

100K 컨텍스트 사이즈를 사용했으며, Spec draft 3은 3090 GPU에 부담이 있어 draft 2를 사용했습니다.

컨텍스트 사이즈가 느려짐에도 불구하고 대부분의 작업에 100K가 충분하다고 판단했습니다.

##Qwen##llama.cpp##GPU##컨텍스트

매일 핵심 AI 소식을 한국어로, 빠르게