RTX 5060 Ti 16GB 로컬 LLM 설정 정보를 담은 공개 저장소를 만들었습니다. vLLM, llama.cpp를 사용한 Qwen3.6 27B 모델 서빙, 컨텍스트 길이 확인, 벤치마크 스크립트 등을 테스트했습니다. 실제 테스트를 기반으로 정확한 설정, 버전, 컨텍스트 길이, KV 설정을 공유하여 재현 가능성을 높이는 데 목표를 두고 있습니다.