본 연구는 코드 생성 모델을 독립적인 작업으로 다루며, 장르를 변경할 때 기존 도메인 데이터를 얼마나 유지해야 하는지 연구합니다. 팝 음악 사전 훈련 모델을 재즈 데이터로 미세 조정하면서 팝 데이터 혼합 비율을 조절했습니다. 2.5K의 팝 데이터 혼합 시 재즈 정확도가 최고점을 기록했지만, 주관적인 청취 선호도는 달랐습니다.
재즈 데이터는 팝 데이터보다 훨씬 작기 때문에, 모든 미세 조정 실행에서 1,513개의 재즈 훈련 시퀀스를 사용했습니다. 팝 정확도는 재즈 전용 미세 조정 시 2.14점이 감소했지만, 약 2.5K의 리허설 샘플(재즈 볼륨의 1.65배)에서 기준선으로 회복되었습니다.
연구 결과는 음악 공동 작업 도구에 대한 시사점을 제공하며, 모든 체크포인트는 HuggingFace Hub에서 공개되었습니다.