사용자가 ai-toolkit을 활용해 Qwen2512 LoRA를 5070Ti 환경에서 학습하려다 CUDA 메모리 부족 오류를 겪었어요. 4비트 양자화와 텍스트 인코더 오프로딩을 적용했지만 학습 속도가 느려 어려움을 겪고 있습니다. LoRA 학습에 적합한 다른 모델이나, 제어망과 함께 스타일 LoRA를 학습할 수 있는 환경 설정 팁을 구하고 있어요.