사용자가 Gemma 4 26B 모델을 4비트 양자화했을 때 45k 컨텍스트에서 루프 문제가 발생했다고 공유했어요. 6비트 양자화 시 문제 해결되었으며, Qwen 3.5 4B 모델도 대화 초반에 루프 현상이 나타났어요.
MoE 모델은 Dense 모델보다 양자화에 더 취약할 수 있다는 의견이 제기되었으며, 사용자는 4비트 양자화 시 루프 문제가 더 자주 발생했다고 언급했어요.
사용자는 다른 사용자들의 경험 공유를 요청하며 Dry 프로젝트 오픈에 대한 의견도 구하고 있어요.