Pulse · AI 뉴스

이폭신 네트워크에서 모델 크기와 데이터가 일반화 확장 법칙에 미치는 영향 분석

arXiv cs.AI · 2026-06-27

연구진은 모델 크기와 데이터 양이 함께 성능에 미치는 영향을 분석했어요. 기존 연구는 주로 데이터나 연산량에 따른 일반화를 설명했지만, 이번 연구는 학습 가능한 파라미터와 샘플 수를 함께 고려했어요. 2층 이차 네트워크에서 데이터 구조를 활용해 일반화 오류를 분석한 결과, 파라미터 수에 따라 다른 확장 구간이 나타났어요.

일반화 오류는 데이터 의존적인 형태를 띠며, 목표의 스펙트럼 구조에 따라 달라져요. 연구진은 구간 전환 시점과 일반화에 미치는 영향을 분석했어요. 연구는 유한 샘플 환경에서 이차 2층 네트워크의 L2 정규화 경험적 테스트 오류 최소화를 연구했어요.

##일반화##확장법칙##이차네트워크##머신러닝##최적화
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기