Krea2 모델의 INT8 양자화 사용 시 RTX 3060 Ti에서 생성 속도가 두 배로 빨라집니다. 하지만 LoRA를 추가하면 생성 시간이 FP8과 동일하거나 더 느려지는 문제가 발생합니다. ComfyUI 사용자들은 이와 유사한 문제를 보고하고 있습니다.
INT8 환경에서 LoRA를 두 개까지 추가해도 생성 속도 향상이 미미합니다. FP8 환경과 비교했을 때 LoRA 추가 시 속도 차이가 거의 없습니다. 이는 ComfyUI 로더 사용 시 발생하는 문제로 추정됩니다.
사용자는 Krea2 모델의 INT8 양자화와 LoRA 적용 시 발생하는 속도 저하 문제를 Reddit 커뮤니티에 공유하며, 다른 사용자들도 유사한 문제를 겪고 있다고 밝혔습니다.