FantasyMaster85 사용자가 MI60 GPU에서 Llama-bench를 30회 실행하여 Frigate와 HomeAssistant에 최적화된 설정 값을 찾았어요. Docker 컨테이너를 사용해 Ubuntu 24.04 환경 설정을 간편하게 구축했죠.
Gemma 4 26B.A4B Q4_1과 Qwen3 35B.A3B Q4_0 모델을 테스트한 결과, HomeAssistant 응답 속도는 1.2초 미만, Frigate 검토 요약 시간은 18초 미만으로 단축됐어요.
Claude가 작성한 스크립트를 통해 다양한 KV 캐시 깊이, flash attention, ubatch 크기, CPU 스레드 수 등을 테스트하여 최적의 성능을 확인하고 결과를 공유했어요.