Reddit 사용자가 LTX-2.3 모델 추론 속도를 최적화하는 방법을 공유했는데, RTX 3080Ti에서 300초에서 45초로 속도를 획기적으로 단축했습니다.
해결 방법으로는 해상도 감소, Spatial Upscaler 조정, Stage 2 스텝 감소, INT8 모델 사용, GGUF 대비 INT8 성능 우수, 커스텀 노드 개발 등이 있습니다.
INT8 모델 사용이 가장 큰 성능 향상을 가져왔으며, VRAM 오프로딩 환경에서 GGUF보다 INT8가 더 빠른 속도를 보였습니다.
최적화된 설정에서 832x1024 해상도, 49 프레임으로 45초 안에 추론이 가능하며, 첫 번째 실행 시에는 모델 로딩으로 인해 시간이 더 소요합니다.