사용자가 M1 Max Mac에서 Agents-A1-Q8_0-GGUF 모델을 테스트해봤어요. opencode 사용 시 Qwen 수준의 성능을 보여주는 듯한 인상을 받았다고 해요. 262K 컨텍스트를 활용해 500 t/s pp, 40 t/s tg의 성능을 기록했어요.
llama-server를 통해 모델을 실행했으며, 추천 파라미터 설정을 사용했어요. 더 많은 파라미터 튜닝을 통해 성능 개선 가능성이 있다고 언급했어요.
다른 사용자들의 경험 공유를 요청하며 게시글을 마무리했어요.