사용자가 2x3090 GPU 환경에서 M2.7 모델을 128K 컨텍스트로 구동하는 설정과 경험을 공유했어요. 코딩 에이전트 워크플로우에 적합하도록 정확도를 우선시하며, 속도는 상대적으로 느린 편이라고 밝혔어요. M2.7 모델의 draft 모델 공개를 기대했지만, 공개되지 않았다고 언급했습니다.
사용자가 ik_llama 플래그를 통해 설정한 구체적인 옵션들을 공유하며, 다른 사용자들의 조언과 추가 최적화 팁을 구하고 있어요. 속도 향상을 위한 추가적인 모델 추천이나 최적화 팁을 기다리고 있습니다.