희귀 클래스 데이터 불균형 문제를 해결하기 위해, 실제 이미지 20~50장으로 LoRA 어댑터를 학습하고 디퓨전 모델을 활용해 시뮬레이션 데이터를 생성하는 방법을 제안합니다.
흉부 X선 병리 분류와 산업용 표면 균열 탐지 분야에서 실제 데이터만으로 평가한 결과, 시뮬레이션 데이터 증강은 희귀 클래스 재현율과 F1 점수를 향상시켰습니다.
적절한 양의 시뮬레이션 데이터 증강은 성능 향상에 효과적이지만, 데이터 비율이 증가함에 따라 효과는 감소하는 경향을 보였습니다.