Pulse · AI 뉴스

LeVo 2: 계층적 모델링과 점진적 후처리로 안정적이고 멜로디컬한 노래 생성

LeVo 2 · 2026-06-30

LeVo 2는 일관성과 음악성을 유지하며 가사와 프롬프트를 따르는 풀 길이 노래 생성을 위한 LLM-Diffusion 프레임워크입니다. LeLM은 먼저 의미론적 계획을 위해 혼합 토큰을 예측하고, 트랙별 세부 조정은 병렬로 보컬 및 반주 토큰을 예측합니다. 점진적 후처리를 통해 생성 품질, 제어 가능성, 음악성을 개선하는 SFT, 대규모 오프라인 DPO, 폐루프 세미 온라인 DPO를 적용했습니다.

자동 음악 미적 평가 프레임워크는 대규모 데이터에 음악성 계층 조건을 할당하여 음악적 사전 지식을 제공합니다. 이 프레임워크는 음악성 학습, 제어 가능성 정렬, 음향 세부 조정의 최적화 충돌을 완화합니다.

전문가 청취 테스트와 객관적 평가는 LeVo 2가 6가지 주관적 차원에서 오픈 소스 기준선보다 우수하고 일부 청취 지표에서 선도적인 상업 시스템에 접근한다는 것을 보여줍니다.

##음악생성##AI음악##LeVo2
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기