연구진이 바흐 스타일의 피아노 음악을 생성하는 모델 3가지(자기 회귀 LSTM, 잠재 변수 모델, 적대적 네트워크)를 비교했어요. 자기 회귀 LSTM은 음악적 일관성이 가장 뛰어나고, 벡터 양자화는 잠재 변수 모델의 성능을 개선했어요. 적대적 접근 방식은 훈련이 어렵고 스타일 일반화가 부족했어요.
연구는 MIDI 코퍼스를 활용하여 다성 음악의 시퀀스를 모델링하고, 유용한 잠재 표현을 학습하며, 스타일적으로 일관된 작곡을 생성하는 모델의 능력을 평가했어요. 벡터 양자화는 잠재 변수 모델의 후방 붕괴를 완화하고 더 구조화된 출력을 제공하는 데 도움이 됐어요.
연구 결과, 자기 회귀, 잠재 변수, 적대적 접근 방식의 강점과 한계를 보여주며, 바흐 스타일의 상징 음악 생성에 대한 통찰력을 제공했어요.