Reddit 사용자가 Character LoRA 학습을 위한 이미지 캡션 작성에 어려움을 겪고 있어요. 모델 학습 시 캡션 엔지니어링 없이 쉽게 활용할 수 있는 방식을 찾고 있어요.
이미지 전체의 '일시적인 상태'를 태그해야 하지만, 캐릭터 학습 정확성을 확보하는 방법과 캐릭터의 유연성을 유지하는 방법이 궁금해해요.
캐릭터의 스타일과 표정을 태그하면 캐릭터의 개성을 해칠 수 있는지, 아니면 모든 스타일과 표정이 평균화될 수 있는지 고민하고 있어요.