사용자는 에이전트 코딩 작업에 적합한 Qwen 3.6 모델의 컨텍스트 크기를 고민하고 있습니다. 125k 컨텍스트가 에이전트 코딩에 실질적으로 얼마나 유효한지, 그리고 '컴팩트'한 크기가 충분한지 질문했습니다. 5090 GPU 환경에서 Qwen 3.6 모델의 두 가지 설정 모두 약 165~170 토큰/초의 처리 속도를 보입니다.