연구진이 데이터 증강 파이프라인의 정보 손실 문제를 분석하고 새로운 프레임워크 CIM을 제안했어요. CIM은 데이터와 합성 데이터셋 간의 정보 격차를 직접 정량화하고 최소화하여 고품질 정보 압축을 보장해요. ImageNet-1K 데이터셋을 IPC=10으로 80분 만에 압축하며 ResNet-18에서 48.7% Top-1 정확도를 달성, 기존 최고 성능 모델보다 우수한 결과예요.