Pulse · AI 뉴스

MI60 GPU에서 Llama-bench 최적 설정 찾기: Gemma 4와 Qwen3.6 비교

Qwen · 2026-05-24

FantasyMaster85 사용자가 MI60 GPU에서 Llama-bench를 30회 실행하여 Frigate와 HomeAssistant에 최적화된 설정 값을 찾았어요. Docker 컨테이너를 사용해 Ubuntu 24.04 환경 설정을 간편하게 구축했죠.

Gemma 4 26B.A4B Q4_1과 Qwen3 35B.A3B Q4_0 모델을 테스트한 결과, HomeAssistant 응답 속도는 1.2초 미만, Frigate 검토 요약 시간은 18초 미만으로 단축됐어요.

Claude가 작성한 스크립트를 통해 다양한 KV 캐시 깊이, flash attention, ubatch 크기, CPU 스레드 수 등을 테스트하여 최적의 성능을 확인하고 결과를 공유했어요.

##LLM##GPU##llama-bench##MI60##최적화

매일 핵심 AI 소식을 한국어로, 빠르게