사용자가 DeepSeek V4 Pro 모델을 ktransformers 환경에서 64K 컨텍스트까지 성공적으로 구동했습니다. llama-benchy 테스트 결과, 컨텍스트 깊이가 증가함에 따라 처리 속도와 응답 시간이 변화했으며, 32768 컨텍스트까지는 안정적인 성능을 보였습니다. GPU VRAM 사용량은 90815MiB, GPU 전력 사용량은 PP 시 100W, TG 시 150W로 확인되었습니다.