연구진은 어린이의 시각적 경험을 모방한 BabyCL 프레임워크를 개발했어요. 이 프레임워크는 SAYCam 데이터셋을 단 한 번의 시간 순서대로 처리합니다. BabyCL은 시각적 표현 학습과 이미지-텍스트 대비 목적을 결합하고, 다단계 시간 분할과 이중 리플레이 버퍼를 활용하여 성능을 향상시켰어요. BabyCL은 기존 스트리밍 학습 방식보다 우수한 성능을 보이며, 오프라인 학습의 격차를 크게 줄였습니다.