SNLP(Structured Newton Layer Parallelism)는 레이어 의존성으로 인한 지연 병목 현상을 해결하기 위해 개발된 새로운 추론 프레임워크입니다.
SNLP는 레이어 Jacobian을 저렴한 구조적 대역외 역학으로 대체하여 정확한 뉴턴 교정을 가능하게 하고, Identity Newton(IDN) 또는 HC Newton(HCN)을 활용합니다.
실험 결과, SNLP는 Nanochat 모델에서 최대 2.3배의 속도 향상을 달성했으며, PPL을 6.1% 개선했습니다.