Reddit 사용자가 다양한 각도에서 인간의 다중 뷰 샷 데이터셋을 생성하는 방법에 대해 문의했어요. SCAIL-2나 비디오 디퓨전 모델을 활용해 일관성을 유지하며 단일 인간을 여러 뷰에서 생성하는 방법을 고려 중이에요. Qwen Image와 멀티 앵글 LoRA를 시도했지만 결과가 만족스럽지 않았다고 해요.
GPT Image나 Nano Banana 같은 폐쇄형 모델이 더 나은 성능을 낼 수 있을지 궁금해하며, 오픈 모델 커뮤니티에 조언을 구하고 있어요. 데이터셋 생성에 적합한 모델에 대한 의견을 공유해 달라고 요청했어요.
다중 뷰 인간 데이터셋 생성 경험이 있거나 관련 모델에 대한 정보를 알고 있는 사용자의 답변을 기다리고 있습니다.