연구진이 섀텐 노름(Schatten norm) 기반의 새로운 최적화 방법 'Schattor' 패밀리를 제안했어요. Schattor는 SGD와 Muon을 통합하는 방식으로 작동하며, 복잡한 딥러닝 환경에서 더 나은 성능을 낼 수 있도록 설계됐어요.
Schattor 패밀리는 행렬 마틴게일 모멘트 경계를 활용해 확률적 행렬 최적화 문제에서 차원 의존성 없는 정지점 보장(stationarity guarantee)을 입증했어요.
연구진은 블록별 최적화 진행 상황을 적응적으로 조절하는 멀티 블록 확장 기법도 개발하고, 더욱 일반적인 환경에서도 차원 의존성 없는 정지점 보장 가능성을 확인했어요.