Pulse · AI 뉴스

Muown: 행렬 정규화 제어를 통한 뮤온 최적화

Muon · 2026-05-12

연구진은 뮤온(Muon)의 행렬 정규화(spectral norm)이 학습 과정에서 상향으로 치우치는 현상을 발견하고, 이를 개선하기 위해 새로운 최적화 기법인 Muown을 개발했습니다.

Muown은 행렬의 행(row) 크기를 명시적인 최적화 변수로 취급하여, 행렬 정규화 드리프트를 방지하고 학습 안정성을 높이는 방식으로 작동합니다.

FineWeb-Edu 데이터셋에서 124만에서 27억 파라미터 규모의 모델을 사전 학습했을 때, Muown은 기존 뮤온, SOAP, AdamW, Lion 알고리즘보다 더 나은 성능을 보였습니다.

##최적화##뮤온##행렬정규화
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기