Reddit 사용자가 LTX-2.3 오디오 반응 LoRA를 활용해 음악 비디오를 제작하고 경험을 공유했어요. GPT-Image 2.0으로 초기 프레임을 생성하고, LoRA를 적용해 오디오에 반응하는 시각 효과를 구현했어요.
LoRA는 오디오 반응성이 뛰어나지만, 때때로 과도한 움직임과 아티팩트 문제를 야기하며, 텍스트나 세부 묘사에 어려움을 겪을 수 있어요. EDM이나 liquid DnB와 같은 장르에 적합할 것으로 보입니다.
비디오 제작 과정은 BPM 감지, 오디오 분할, 프롬프트 생성, 렌더링, 편집 등 여러 단계를 거쳤으며, 향후 Krea 활용이나 스템 분리 등 개선 방안을 고려 중이에요.