사용자가 Wan 2.2 LoRA 모델 학습 중 17% 지점에서 OOM 에러를 겪고 있습니다. RTX 5090 및 A100-SXM4 GPU에서 동일한 문제가 발생했으며, 학습 시간당 11초 정도 소요됩니다. Wan 1.3B 모델은 동일 데이터셋으로 문제없이 학습되는 상황입니다.
사용자는 기본 설정 및 파라미터 변경을 시도했으나, 여전히 OOM 에러가 발생하고 있습니다. Wan 2.2 학습 설정 정보를 공유해 달라는 요청을 남겼습니다.
현재 RunPod 환경에서 학습을 진행 중이며, 3,000 스텝 학습에 약 9시간이 소요될 것으로 예상됩니다.