사용자 LegacyRemaster가 MiMo-V2.5-IQ3_S 모델을 104만 토큰 컨텍스트로 테스트하며 llama-server.exe를 사용했습니다. MiMo 모델은 minimax 모델보다 처리 속도와 안정성이 뛰어나다고 평가했습니다. 현재 모델이 반복되는 문제가 있지만, repetition penalty 및 온도 조절로 개선되고 있습니다.