llama.cp 웹 채팅에서 추론 기능을 켜고 끌 수 있는 토글 버튼을 추가하는 Tampermonkey 스크립트가 공개됐어요. 이 스크립트는 브라우저 확장 프로그램으로, llama.cp를 매일 수정 없이 사용할 수 있도록 해줘요.
스크립트는 `chat_template_kwargs` 설정을 변경하여 추론 기능을 제어하며, 사용자가 직접 JSON 설정을 변경할 필요가 없어요.
현재 Qwen3.6 모델에서만 테스트되었으며, 다른 모델과의 호환성은 확인되지 않았어요. Reddit 사용자가 직접 개발하고 공유한 스크립트입니다.
스크립트는 `enable_thinking` 설정을 `false`로 설정하여 추론을 비활성화하거나, `true`로 설정하여 활성화합니다. `reasoning_budget`은 0으로 설정돼요.
스크립트는 버튼 클릭 시 `localStorage`에 추론 상태를 저장하여, 브라우저를 다시 시작해도 설정이 유지되도록 합니다.