사용자가 Arrow Lake 시스템에서 Vulkan을 통해 llama.cpp를 실행하는 과정에서 성능 저하를 경험했습니다. Arc 130T iGPU에서 pp256은 100 토큰/s, tg64는 4 토큰/s로 매우 느린 속도를 보였습니다. Zen 4 iGPU에서 Vulkan을 사용하는 것보다 성능이 떨어지는 현상이 발생하여 SYCL 사용을 고려 중입니다.