모델 페이지에 262K 컨텍스트라고 표기되어 있지만, 실제 사용 환경에서는 160K를 넘어서면 생성 속도가 급격히 느려집니다. 사용자는 더 긴 컨텍스트를 사용하려다 세션 속도 저하를 경험했는데, 마케팅하는 최대 컨텍스트와 실제 사용 가능한 컨텍스트가 다르다는 점이 아쉬웠습니다. 150~160K까지는 괜찮은 속도가 유지되지만, 그 이후로는 응답 속도가 눈에 띄게 느려져서 실시간 대화처럼 느껴지지 않습니다.