llama.cpp 프로젝트에서 Step 3.7 Flash 모델의 느린 추론 속도 문제를 해결하기 위한 수정 사항이 적용됐습니다. 입력 데이터 trimming이 문제 해결책이 아니었던 것으로 확인됐습니다. 사용자들은 Step 3.5 Flash 모델을 계속 사용하고 있습니다.