AMD가 RDNA3 GPU(7900 XTX, W7900)에서 Qwen 3.6 모델 추론 속도를 높이는 hipEngine 오픈 소스 프로젝트를 공개했어요. hipEngine은 ROCm 네이티브 환경에서 작동하며, Python 기반으로 C++로 구현돼 AMD native 라이브러리를 활용해요.
hipEngine은 기존 llama.cpp와 경쟁력 있는 성능을 보여주며, 특히 128K 컨텍스트 길이에서 빠른 프리필 속도를 제공해요. 또한 INT8 KVCache를 통해 24GB 메모리 내에서 Qwen 3.6 256K 컨텍스트를 실행할 수 있어요.
hipEngine은 AGPLv3 라이선스로 공개되었으며, 코드 최적화 과정에서 AI가 활용되었음을 알렸어요. 관심 있는 사용자는 코드 검토, 자체 최적화 등을 통해 프로젝트에 참여할 수 있어요.