연구진이 페르시아 음악을 위한 최초의 대규모 데이터셋을 구축했어요. 900시간 분량의 고품질 오디오 샘플로, 팝, 전통, 현대 스타일 등 다양한 장르를 포함하고 있어요. MusicGen 모델을 페르시아 음악 데이터로 튜닝하여 페르시아 음악 스타일을 더 잘 반영하는 음악을 생성할 수 있도록 만들었어요.
주관적, 객관적 지표를 통해 모델 성능을 평가한 결과, 생성된 음악이 페르시아 스타일 관습에 더 잘 부합하는 것을 확인했어요. 이 연구는 페르시아 음악 연구를 위한 새로운 자원을 제공하고, 음악 생성 모델의 문화적, 언어적 맥락 적응 가능성을 보여줘요.
연구 결과, 생성된 음악이 의도한 스타일 태그와 더 잘 일치하는 비율을 측정하여 의미론적 정렬을 평가했어요.