생성 AI의 확산으로 모델 파라미터가 자연 데이터뿐 아니라 다른 모델의 합성 결과로도 지속적으로 업데이트되는 상호작용 학습 환경이 등장했어요. 이 환경은 기존 통계 학습의 핵심 가정을 훼손하고 모델 훈련 과정을 복잡하게 만듭니다. 모델 붕괴 현상은 모델이 이전 세대 모델의 합성 데이터를 기반으로 훈련되면서 성능이 점진적으로 저하되는 현상이에요.
본 연구에서는 상호작용 그래프의 토폴로지가 모델 붕괴 발생에 결정적인 영향을 미친다는 것을 보여주고, 선형 회귀 및 일반 M-추정량에 대한 명확한 필요충분조건을 도출하고, 유한 표본 결과 및 점근적 보장을 확립했어요. 다양한 수치 실험을 통해 이론적 결과를 뒷받침합니다.
기존 연구는 단일 모델이 자체 출력에 훈련되는 경우의 모델 붕괴에만 초점을 맞췄지만, 본 연구는 다중 모델의 상호작용 설정을 포괄하여 이 격차를 해소합니다.