Qwen 3.6 모델에서 CoT(Chain of Thought) 종료 시 </think> 토큰 대신 </thinking> 토큰 시퀀스가 출력되는 문제가 발생했어요.
이로 인해 CoT 종료 지점 감지 실패 및 관련 시스템 혼란을 야기하며, llama-server 수정이나 OpenAI completions API 직접 구현 등의 해결책이 필요해요.
사용자는 양자화(quantization)와 관련되었을 가능성을 제기하며, 유사한 문제를 경험한 사용자의 의견을 구하고 있어요.