Pulse · AI 뉴스

Qwen3.6 27B int4 자동 라운드 최적 레시피 공개

Qwen · 2026-05-13

사용자가 'Lorbus/Qwen3.6-27B-int4-AutoRound' 퀀트 모델을 사용해 RTX 5090에서 좋은 성능을 경험했습니다.

더 높은 품질을 위해 'autorund-best' 프리셋을 사용한 새로운 자동 라운드 퀀트 모델(int4)을 개발하고, 기본 버전과 코드 보정 버전을 공개했습니다.

새 모델은 토큰 생성 속도가 코어 60-80tps, MTP 3 사용 시 130-160tps를 보여주며, 챗 템플릿 변경에 민감하므로 v11을 사용하는 것이 좋습니다.

##Qwen##모델출시##퀀타이제이션
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기