Qwen 3.6 모델이 KV 캐시 무효화 문제를 해결하기 위해 새로운 preserve_thinking 플래그를 도입했습니다. preserve_thinking 플래그는 에이전트 시나리오에서 추론 맥락을 유지하고 토큰 소비를 줄이며 KV 캐시 활용도를 최적화하는 데 도움이 됩니다. LM Studio에서는 아직 해당 기능을 지원하지 않지만, oMLX에 대한 PR이 제출되어 지원이 추가될 예정입니다.