Pulse · AI 뉴스

신경망 학습 역학 불안정성의 비정상 스펙트럼 특징

arXiv cs.LG · 2026-05-22

연구진은 딥 네트워크의 학습 불안정성(손실 급증, 진동 수렴, 기울기 병리 등)에 대한 연산자 이론적 설명을 제시했어요.

Adam 옵티마이저의 경우, 헤세 행렬과 적응형 프리컨디셔너의 교환자 [H, M]이 비정상성을 제어하고, 모멘텀 SGD의 경우 업데이트 맵의 증강 상태 공간 구조에서 비롯된다고 밝혔어요.

연구 결과, 스펙트럼 반지름이 1보다 작더라도 일시적 증폭의 조기 경고 지표로 κ(V)를 활용하는 가성 스펙트럼 선행 경계를 도출하고, 예외점이 나타나는 경우 κ(V) -> ∞ 극한의 경우로 설정했어요.

##신경망##학습안정성##최적화##연산자이론
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기